基于语义关系查询扩展的文档重构方法

被引:145
作者
张敏
宋睿华
马少平
机构
[1] 清华大学计算机科学与技术系智能技术与系统国家重点实验室
[2] 清华大学计算机科学与技术系智能技术与系统国家重点实验室 北京
关键词
文档重构; 查询扩展; 语义相似性; 词不匹配; 概念检索;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
已知文档与用户查询之间相同概念不同表达形式造成的词不匹配问题是影响信息检索效果的重要原因之一 .该文提出了根据词之间的语义关系进行扩展和替换的文档重构方法 .它与传统的查询扩展不同 ,实现了同一概念信息的聚集 ,是更接近于人类进行信息查找的思维方法 .进一步地 ,研究给出一种有效的实时文档重构检索策略 ,解决了文档重构方法在实际应用中的可行性 .在标准测试数据集上的实验表明 ,基于查询扩展的文档重构方法不仅比不扩展的最佳性能始终有 14 %~ 2 3.4 %的提高 ,而且比相对应的传统查询扩展方法也有约 16 %的提高 .
引用
收藏
页码:1395 / 1401
页数:7
相关论文
empty
未找到相关数据