基于概率潜在语义分析的中文信息检索

被引:11
作者
罗景
涂新辉
机构
[1] 武汉科技大学计算机学院
关键词
概率潜在语义分析; 中文信息检索; 索引技术; 关键词抽取;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率潜在语义模型用于中文信息检索,实验结果表明,概率潜在语义模型相对于传统的向量空间模型能够显著地提高检索的平均精度。
引用
收藏
页码:199 / 201
页数:3
相关论文
共 2 条
[1]   Unsupervised Learning by Probabilistic Latent Semantic Analysis [J].
Thomas Hofmann .
Machine Learning, 2001, 42 :177-196
[2]   Using linear algebra for intelligent information retrieval [J].
Berry, MW ;
Dumais, ST ;
OBrien, GW .
SIAM REVIEW, 1995, 37 (04) :573-595