基于情感词典的中文微博情感倾向分析研究

被引:0
作者
陈晓东
机构
[1] 华中科技大学
关键词
微博; 情感词典; 情感倾向; 权值计算; 自然语言理解;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
近年来微博的出现,极大丰富了人们的生活。其简短写作,便捷发布,实时交互的特点深受大众欢迎。越来越多的用户乐于在微博平台上分享信息,交流观点和情感。通过对这些信息展开情感分析,可以实现微博营销、品牌宣传、客户关系管理、舆情监控等。当前微博情感分析研究大多是针对于英文微博的,而中文微博的情感分析研究还处于起步阶段。 情感分析主要是判别微博文本的情感倾向性,即属于正面、负面、中性。根据中文微博的自身特点,在传统文本情感分析的已有基础上,展开对微博的情感倾向分析。首先,对当前已有情感词汇资源加以总结和整理,并运用了扩展的情感倾向点互信息算法(SemanticOrientationPointwiseMutualInformation,SO-PMI)对新浪微博语料进行实验,自动获得领域情感词,构建了一个面向中文微博的情感词典。其次,基于中文微博表达多元化的特点,对微博文本进行了相应预处理,并采用微博消息文本中的情感词作为特征选择方法,对微博消息文本中存在的否定词、程度副词、感叹句、反问句、以及微博表情符号等进行相应分析处理。最后对整条微博消息作加权计算获得其情感倾向性,实现了一个面向中文微博的情感倾向分类系统。 实验数据选用数据堂的新浪微博语料,对来自科技、体育、娱乐三个领域的微博消息进行人工标注后,实验验证了该方法的可行性。实验结果显示:该方法获得的最高准确率为74.2%,平均准确率为70.5%,取得了较好的效果,对中文微博的情感倾向分析进行了初步探索。
引用
收藏
页数:58
共 20 条
[1]
Sentiment in Twitter Events [J].
Thelwall, Mike ;
Buckley, Kevan ;
Paltoglou, Georgios .
JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 2011, 62 (02) :406-418
[2]
A machine learning approach to sentiment analysis in multilingual Web texts [J].
Boiy, Erik ;
Moens, Marie-Francine .
INFORMATION RETRIEVAL, 2009, 12 (05) :526-558
[3]
Measuring praise and criticism.[J].Peter D. Turney;Michael L. Littman.ACM Transactions on Information Systems (TOIS).2003, 4
[4]
Exposure in wireless sensor networks: Theory and practical solutions [J].
Megerian, S ;
Koushanfar, F ;
Qu, G ;
Veltri, G ;
Potkonjak, M .
WIRELESS NETWORKS, 2002, 8 (05) :443-454
[5]
Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[6]
褒义词词典.[M].史继林;朱英贵编著;.四川辞书出版社.2005,
[7]
贬义词词典.[M].杨玲;朱英贵编著;.四川辞书出版社.2005,
[8]
基于确定话题和情感极性的博客文本聚类研究 [D]. 
庞俊 .
武汉理工大学,
2010
[9]
中文句子情感倾向分析 [D]. 
郭叶 .
北京邮电大学,
2010
[10]
基于赋权粗糙隶属度的文本情感分类方法 [J].
王素格 ;
李德玉 ;
魏英杰 .
计算机研究与发展, 2011, 48 (05) :855-861