使用机器学习方法进行新闻的情感自动分类

被引:105
作者
徐军
丁宇新
王晓龙
机构
[1] 哈尔滨工业大学深圳研究生院智能计算研究中心
基金
国家自然科学基金重点项目;
关键词
计算机应用; 中文信息处理; 文本分类; 情感分析; 贝叶斯; 最大熵;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
本文主要研究机器学习方法在新闻文本的情感分类中的应用,判断其是正面还是负面。我们利用朴素贝叶斯和最大熵方法进行新闻及评论语料的情感分类研究。实验表明,机器学习方法在基于情感的文本分类中也能取得不错的分类性能,最高准确率能达到90%。同时我们也发现,对于基于情感的文本分类,选择具有语义倾向的词汇作为特征项、对否定词正确处理和采用二值作为特征项权重能提高分类的准确率。总之,基于情感的文本分类是一个更具挑战性的工作。
引用
收藏
页码:95 / 100
页数:6
相关论文
共 1 条
[1]   基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20