基于集成学习的情感模糊计算分类方法

被引:15
作者
刘磊 [1 ,2 ]
李学勇 [3 ]
黄永峰 [1 ,2 ]
机构
[1] 清华大学电子工程系信息认知与智能系统研究所
[2] 清华大学信息科学与技术国家实验室
[3] 河南科技学院信息工程学院
关键词
量化情感字典; 量化情感词典; 情感分类; 无监督方法; 情感模糊计算; 多分类器集成;
D O I
10.16208/j.issn1000-7024.2018.07.014
中图分类号
TP181 [自动推理、机器学习]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
针对现有情感词典没有区分相同极性情感词的情感强度,没有考虑情感强度的模糊性,导致情感分类效果较差的问题,基于自学习的无监督情感分类方法因采用单一分类器导致在生成伪标注数据集时,会引入较多错误的问题,提出一种基于集成学习的情感模糊计算分类方法。通过基于量化情感字典的模糊计算提高情感预分类精度,通过多分类器集成减少伪标注数据的错误率。在现有公开数据集的基础上,与其它算法进行实验结果比较,表明了该方法的准确性和有效性。
引用
收藏
页码:1872 / 1876+1953 +1953
页数:6
相关论文
共 10 条
[1]
文本情感分类及观点摘要关键问题研究 [D]. 
张冬梅 .
山东大学,
2012
[2]
Lexicon-Based Methods for Sentiment Analysis [J].
Taboada, Maite ;
Brooke, Julian ;
Tofiloski, Milan ;
Voll, Kimberly ;
Stede, Manfred .
COMPUTATIONAL LINGUISTICS, 2011, 37 (02) :267-307
[3]
基于多粒度计算和多准则融合的情感分类 [J].
王丙坤 ;
黄永峰 ;
李星 .
清华大学学报(自然科学版), 2015, 55 (05) :497-502
[4]
一种主动学习和协同训练相结合的半监督微博情感分类方法 [J].
毕秋敏 ;
李明 ;
曾志勇 .
现代图书情报技术, 2015, (01) :38-44
[5]
基于文本和社交语境的微博数据情感分类 [J].
吴方照 ;
王丙坤 ;
黄永峰 .
清华大学学报(自然科学版), 2014, 54 (10) :1373-1376+1383
[7]
基于词典和规则集的中文微博情感分析 [J].
王志涛 ;
於志文 ;
郭斌 ;
路新江 .
计算机工程与应用 , 2015, (08) :218-225
[8]
基于新闻数据的中文人物社会关系抽取研究 [D]. 
刘锦文 .
中国科学技术大学,
2016
[9]
基于深度学习的文本情感分类研究 [D]. 
朱少杰 .
哈尔滨工业大学,
2014
[10]
面向情感搜索的中文语料分析及其分词 [D]. 
刘浩 .
北京邮电大学,
2014