基于元搜索引擎的多关键词检索技术

被引:13
作者
陈伟雄
马少平
步建华
不详
机构
[1] 清华大学深圳研究生院
[2] 清华大学智能技术与系统国家重点试验室
[3] 大亚湾核电营运管理有限公司信息中心 深圳
[4] 大亚湾核电营运管理有限公司信息中心
[5] 深圳
[6] 北京
关键词
元搜索引擎; 核心关键词; 分级权重;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
文章根据主要中文搜索引擎Google和Baidu对多关键词的查询处理存在的缺陷,提出了“核心关键词”的概念和“分级权重”的计算方法;并进而提出了将基本搜索引擎搜索结果与网页内容分析合并相关度算法和元搜索引擎的准确度偏差评价公式。研究表明,元搜索引擎不但消除了死链接和重复链接,而且准确度偏差与Google和Baidu相比,分别减少7.26%和12.47%,准确度得到了一定提高。
引用
收藏
页码:83 / 87+93 +93
页数:6
相关论文
共 7 条
[1]  
ConstraintforFu-sionAlgorithmsinMetaSearchEngineSystems. YANGXiao-hua,LIUZhen-yu,TANMin-sheng. JournalofSoftware . 2002
[2]  
TheAnatomyofaLarge-ScaleHyper-textualWebSearchEngine. SergeyBrin,LawrencePage. http://www-db.stanford.edu/-backrub/google.html .
[3]  
AdaptiveQueryProcessingForInternetApplications. ZacharyGIves,AlonYLevy,DanielSWeldetal. IEEEDataEngineeringBul-letin . 2000
[4]  
AdaptiveAgentsforInformationGatheringfromMultiple,DistributedInformationSources. YizhongFan,SusanGauch. Proceedingsof1999AAAISymposiumonIntelligentAgentsinCyberspace . 1999
[5]  
Experienceswithselectingsearchenginesusingmetasearch. DanielDreilinger,AdeleEHowe. ACMTransactionsonInformationSys-tems . 1997
[6]  
InformationRetrieval. CJVanRijsbergenetal. .
[7]  
ModernInformationRe-trieval. RicardoBaeza-Yates,BerthierRibeo-Neto. .