基于潜在语义索引的文本特征词权重计算方法

被引:16
作者
李媛媛
马永强
机构
[1] 西南交通大学信息科学与技术学院
关键词
潜在语义索引; Sigmiod函数; 位置因子; 权重算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
潜在语义索引具有可计算性强,需要人参与少等优点。对其中重要的优化过程——权重计算,进行了深入分析。针对目前应用最广泛的TF-IDF方法中,采用线性处理的不合理性以及难以突出对文本内容起关键性作用的特征的缺点,提出了一种基于"Sigmiod函数"和"位置因子"的新权重方案。突出了文本中不同特征词的重要程度,更有利于潜在语义空间的构造。通过实验平台"中文潜在语义索引分析系统"的测试结果表明,该权重方法更利于基于潜在语义的检索性能的提高。
引用
收藏
页码:1460 / 1462+1466 +1466
页数:4
相关论文
empty
未找到相关数据