基于信息增益的LDA模型的短文本分类

被引:5
作者
沈竞
机构
[1] 解放军后勤工程学院图书馆
关键词
信息增益; LDA模型; 文本分类;
D O I
10.15998/j.cnki.issn1673-8012.2011.06.018
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.
引用
收藏
页码:64 / 66
页数:3
相关论文
共 1 条
[1]  
面向网络舆情态势分析的文本分类研究.[D].侯松.国防科学技术大学.2009, S1