VSM中词权重的信息熵算法

被引:8
作者
刁倩
王永成
张惠惠
何骥
机构
[1] 上海交通大学!上海
关键词
向量空间模型; 自动分类; IDF; Shannon信息熵;
D O I
暂无
中图分类号
G354.2 [情报检索方法和工具];
学科分类号
1205 ;
摘要
本文提出一种基于Shannon信息熵的向量空间模型 (VSM )中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了向量空间模型 (VSM)中两种词权重计算的具体公式。
引用
收藏
页码:354 / 358
页数:5
相关论文
empty
未找到相关数据