【惠州网站建设】基于网页结构与语言特征的垃圾网页链接检测方法

技术分享 | 2021/06/02

基于网页结构与语言特征的垃圾网页链接检测方法。检测spam网页仍是一个具有挑战性的研究领域。经过实验与对比，算法已经可以基本解决spam检测的问题，准确率较高，又不会出现过高的误报率和漏报率。同时，如果用户对误报率和漏报率有所要求时，也可以通过修正优势率的阈值来实现。

但是，算法仍有一些需要深入研究的问题。后续工作需要更进一步扩大并完善初始数据，从而优化对优势率字典的构建。同时，希望更进一步地研究优势率阈值的选取，从而更准确地对网页进行检测。

【惠州网站建设】基于网页结构与语言特征的垃圾网页链接检测方法

最后，网页中，块与块之间是有联系的，而本算法简化了这一部分，把块当作独立的个体进行处理。所以，在后续研究中，可以将块与块之间的相似度，如结构相似度、文本内容相似度等加入特征的选取和计算、

tag:

深圳网站开发

广州晴网信息科技有限公司
广州晴网信息科技有限公司是一家主要从事公众号商城开发、小程序商城开发、定制软件开发、网站建设、百度关键词优化推广服务的企业；基于SaaS模式，整合资源、深度挖掘，向商户提供强大的微商城系统和完整的移动电商解决方案，共建服务生态，服务百万商家。
地址：广州市黄埔区锐丰中心2号楼403
业务部：020-28186891
技术部：020-28186891
邮箱：10000@138.la
网址：www.138.la

【惠州网站建设】基于网页结构与语言特征的垃圾网页链接检测方法

广州网站开发

深圳网站开发

深圳网站建设

公众号推广

小程序商城