基于文摘的信息检索模型

被引:6
作者
李卫疆
赵铁军
臧文茂
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
信息检索; 语言模型; 文摘; 文摘检索模型; 平滑方法;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
摘要
基于文摘的检索模型是基于一个假设。即出现在文摘中的词要比未出现在文摘中的词更能表达文章的主题,因此对检索贡献更大.提出了两个基于文摘的语言检索模型,一个是用文摘模型代替文档模型直接检索文件(SQL),另一个是用文摘模型平滑文档模型(SBDM).在TREC数据集上的实验表明,该模型能够提高检索的性能.其中,SBDM的性能一致接近或优于传统的标准文档查询相似模型.有两个方面的贡献,一方面提出了面向检索的文摘抽取方法并考察了这些文摘方法对检索性能的影响;另一方面提出了新的检索模型,即基于文摘的检索模型.
引用
收藏
页码:2329 / 2338
页数:10
相关论文
共 3 条
  • [1] A probabilistic model of information retrieval: development and comparative experiments[J] . K Sparck Jones,S Walker,S.E Robertson.Information Processing and Management . 2000 (6)
  • [2] A probabilistic model of information retrieval: development and comparative experiments[J] . K. Sparck Jones,S. Walker,S.E. Robertson.Information Processing and Management . 2000 (6)
  • [3] SCISOR: extracting information from on-line news[J] . P. S. Jacobs,Lisa F. Rau.Communications of the ACM . 1990 (11)