文本检索的统计语言建模方法综述

被引:17
作者
丁国栋
白硕
王斌
机构
[1] 中国科学院计算技术研究所
关键词
信息检索; 统计语言建模; 语言模型; 平滑;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
统计语言建模技术(statisticallanguagemodeling,SLM)已逐渐成为当前语言信息处理的主流技术之一·近几年的研究和实验表明,SLM技术在文本检索领域有着广阔的发展前景和拓展空间·对基于SLM的文本检索方法(SLMTR)进行了综述,重点论述SLMTR的主要方法和关键技术·首先对查询似然检索模型进行形式化的描述;然后详细论述语言模型的估计和数据平滑问题;并讨论了平滑对检索性能的影响;之后简要介绍了对查询似然模型的一些主要的扩展和改进工作;最后的总结部分讨论了SLMTR所面临的一些挑战·
引用
收藏
页码:769 / 776
页数:8
相关论文
共 2 条
[1]  
Not So Naive Bayes: Aggregating One-Dependence Estimators[J] . Geoffrey I. Webb,Janice R. Boughton,Zhihai Wang.Machine Learning . 2005 (1)
[2]   Bayesian Network Classifiers [J].
Nir Friedman ;
Dan Geiger ;
Moises Goldszmidt .
Machine Learning, 1997, 29 :131-163