基于情感关键句抽取的情感分类研究

被引:30
作者
林政 [1 ,2 ]
谭松波 [1 ]
程学旗 [1 ]
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院大学
基金
国家自然科学基金重点项目;
关键词
情感分类; 关键句; 分类器融合; 联合训练; 有监督学习; 半监督学习;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
情感分析需要解决的一个重要问题是判断一篇文档的极性是正面的还是负面的.情感分类的正确率很难达到普通文本分类的水平,因为情感分类更难更复杂.在判断文档的情感极性时,不同的句子具有不同的情感贡献度,所以,对整篇文档的关键句和细节句进行区分将有助于提高情感分类的性能.关键句通常简短且具有判别性,而细节描述句通常复杂多样且容易引入歧义.在关键句抽取算法中,考虑3类属性:情感属性、位置属性和关键词属性.为了更好地利用关键句和细节句之间的差异性和互补性,将抽取的关键句分别用于有监督的和半监督的情感分类.在有监督情感分类中,采用的是分类器融合的方法;在半监督情感分类中,采用的是Co-training算法.在8个领域上进行实验,结果表明所提方法性能明显优于Baseline,从而证明情感关键句抽取算法是有效的.
引用
收藏
页码:2376 / 2382
页数:7
相关论文
共 3 条
[1]   基于随机游走模型的跨领域倾向性分析研究 [J].
吴琼 ;
谭松波 ;
许洪波 ;
段洣毅 ;
程学旗 .
计算机研究与发展, 2010, 47 (12) :2123-2131
[2]   一种新的情感词汇语义倾向计算方法 [J].
杜伟夫 ;
谭松波 ;
云晓春 ;
程学旗 .
计算机研究与发展, 2009, 46 (10) :1713-1720
[3]   基于语言建模的文本情感分类研究 [J].
胡熠 ;
陆汝占 ;
李学宁 ;
段建勇 ;
陈玉泉 .
计算机研究与发展, 2007, (09) :1469-1475