共 7 条
基于信息增益与信息熵的TFIDF算法
被引:48
作者:
李学明
李海瑞
薛亮
何光军
机构:
[1] 重庆大学计算机学院
来源:
关键词:
文本分类;
信息增益;
信息熵;
TFIDF算法;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
传统的特征词权重算法TFIDF忽略了特征词在类内、类间的分布对其权重的影响。针对该问题,引入信息熵的概念,对基于信息增益的TFIDF算法(TFIDFIG)进行改进,提出一种基于信息增益与信息熵的TFIDF算法(TFIDFIGE)。实验结果表明,与传统的TFIDF算法和TFIDFIG算法相比,TFIDFIGE算法的查准率和查全率较高。
引用
收藏
页码:37 / 40
页数:4
相关论文