学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于信息增益的LDA模型的短文本分类
被引:5
作者
:
沈竞
论文数:
0
引用数:
0
h-index:
0
机构:
解放军后勤工程学院图书馆
沈竞
机构
:
[1]
解放军后勤工程学院图书馆
来源
:
重庆文理学院学报(自然科学版)
|
2011年
/ 30卷
/ 06期
关键词
:
信息增益;
LDA模型;
文本分类;
D O I
:
10.15998/j.cnki.issn1673-8012.2011.06.018
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
在基于LDA的短文本分类基础上进行改进,提出信息增益结合LDA的短文本分类方法.该方法采用信息增益计算词汇对于文本分类的贡献度,提高"作用词"的权重,过滤掉"非作用词",最后对过滤后的短文本进行LDA主题建模,并采用中心向量法建立文本类别模型.实验证明,该方法随着作用词比例的减少,分类性能有较大的提高.
引用
收藏
页码:64 / 66
页数:3
相关论文
共 1 条
[1]
面向网络舆情态势分析的文本分类研究.[D].侯松.国防科学技术大学.2009, S1
←
1
→
共 1 条
[1]
面向网络舆情态势分析的文本分类研究.[D].侯松.国防科学技术大学.2009, S1
←
1
→