基于文本语义和表情倾向的微博情感分析方法

被引:23
作者
王文 [1 ,2 ]
王树锋 [1 ,2 ]
李洪华 [1 ]
机构
[1] 常州工学院计算机信息工程学院
[2] 常州工学院常州市软件技术研究与应用重点实验室
关键词
文本语义; 表情倾向; 微博; 情感分析; 机器学习; 微博爬虫; 应用程序编程接口; 情感词典; 语义相似度;
D O I
10.14177/j.cnki.32-1397n.2014.06.005
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。
引用
收藏
页码:733 / 738+749 +749
页数:7
相关论文
共 10 条
[1]   基于深度学习的微博情感分析 [J].
梁军 ;
柴玉梅 ;
原慧斌 ;
昝红英 ;
刘铭 .
中文信息学报, 2014, (05) :155-161
[2]   基于多特征与复合分类法的中文微博情感分析 [J].
吴维 ;
肖诗斌 .
北京信息科技大学学报(自然科学版), 2013, 28 (04) :39-45
[3]   中文微博情感分析研究综述 [J].
周胜臣 ;
瞿文婷 ;
石英子 ;
施询之 ;
孙韵辰 .
计算机应用与软件, 2013, 30 (03) :161-164+181
[4]   基于表情图片与情感词的中文微博情感分析 [J].
张珊 ;
于留宝 ;
胡长军 .
计算机科学, 2012, 39(S3) (S3) :146-148+176
[5]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, (01) :73-83
[6]   基于机器学习的中文微博情感分类实证研究 [J].
刘志明 ;
刘鲁 .
计算机工程与应用 , 2012, (01) :1-4
[7]   基于Stacking组合分类方法的中文情感分类研究 [J].
李寿山 ;
黄居仁 .
中文信息学报, 2010, 24 (05) :56-61
[8]   基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20
[9]  
基于共现链的微博情感分析技术的研究与实现[D]. 王岩.国防科学技术大学. 2011
[10]  
Exploring traversal strategy for web forum crawling .2 Wang Yida,Yang Jiang-Ming,Lai Wei,et al. Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval . 2008