改进的基于布尔模型的网页查重算法

被引:8
作者
连浩
刘悦
许洪波
程学旗
机构
[1] 中国科学院计算技术研究所
关键词
网络; 特征; 布尔模型; 相似网页;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
提出一种基于布尔模型的网页查重算法,利用布尔模型寻找适当的特征,建立索引以减少网页文档之间的比较次数。实验验证了这种算法的性能,并取得了较好的效果。
引用
收藏
页码:36 / 39
页数:4
相关论文
empty
未找到相关数据