基于用户查询关键词的网页去重方法研究

被引:5
作者
谢蕙
秦杰
胡双双
机构
[1] 河南工业大学信息科学与工程学院
关键词
网页去重; 元搜索; 特征码; 中文分词;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
在研究传统的基于特征码去重算法的基础上,针对元搜索引擎中网页重复现象,提出一种基于用户查询关键词的网页去重方法,提高元搜索引擎检索质量,并且介绍算法的实现过程,通过实验验证算法的有效性。
引用
收藏
页码:43 / 46
页数:4
相关论文
共 3 条
[1]   中文信息处理中自动分词技术的研究与展望 [J].
刘迁 ;
贾惠波 .
计算机工程与应用, 2006, (03) :175-177+182
[2]   元搜索引擎研究 [J].
唐培丽 ;
胡明 ;
解飞 .
气象水文海洋仪器, 2005, (Z1) :62-66
[3]   A systematic study on parameter correlations in large-scale duplicate document detection [J].
Ye, Shaozhi ;
Wen, Ji-Rong ;
Ma, Wei-Ying .
KNOWLEDGE AND INFORMATION SYSTEMS, 2008, 14 (02) :217-232