信息检索加权理论与技术:基于VSM模型的分析

被引:5
作者
方清华
机构
[1] 不详
[2] 武汉大学信息管理学院
[3] 不详
关键词
信息检索; 向量空间模型; 加权理论; 加权技术; 统计分布;
D O I
暂无
中图分类号
TP301 [理论、方法];
学科分类号
081202 ;
摘要
分析了信息检索加权技术的理论基础,探讨了局部统计分布特性和全局分布特性在词加权技术中的应用以及不对称分布对加权性能的影响,结合词加权技术的基本原理提出了词加权形式化描述与计算模型,并运用该模型对基于向量空间模型的加权技术及其优化策略进行了分析。针对加权技术需解决的关键问题描述文献内容和区分文献,提出计算文献权重应同时利用特征词局部分布和全局分布信息,并消除文献长度和语义信息缺乏等不对称分布问题的影响。
引用
收藏
页码:73 / 76
页数:4
相关论文
共 2 条
[1]  
Evolving General Term-Weighting Schemes for Information Retrieval: Tests on Larger Collections[J] . Ronan Cummins,Colm O’riordan.Artificial Intelligence Review . 2005 (3)
[2]   A study of smoothing methods for language models applied to information retrieval [J].
Zhai, CX ;
Lafferty, J .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2004, 22 (02) :179-214