行业动态基于网页结构与语言特征的垃圾网页链接检测方法

2022-05-02    分类: 网站建设

检测spam网页仍是一个具有挑战性的研究领域。经过实验与对比,算法已经可以基本解决spam检测的问题,准确率较高,又不会出现过高的误报率和漏报率。同时,如果用户对误报率和漏报率有所要求时,也可以通过修正优势率的阈值来实现。

但是,算法仍有一些需要深入研究的问题。后续工作需要更进一步扩大并完善初始数据,从而优化对优势率字典的构建。同时,希望更进一步地研究优势率阈值的选取,从而更准确地对网页进行检测。

最后,网页中,块与块之间是有联系的,而本算法简化了这一部分,把块当作独立的个体进行处理。所以,在后续研究中,可以将块与块之间的相似度,如结构相似度、文本内容相似度等加入特征的选取和计算、

文章题目:行业动态基于网页结构与语言特征的垃圾网页链接检测方法
当前路径:https://www.cdcxhl.com/news/148722.html

成都网站建设公司_创新互联,为您提供网站建设网站收录企业网站制作营销型网站建设自适应网站微信小程序

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

h5响应式网站建设