共 31 条
基于微博的细粒度情感分析
被引:28
作者:
敦欣卉
[1
]
张云秋
[1
]
杨铠西
[2
]
机构:
[1] 吉林大学公共卫生学院
[2] 大连理工大学中日国际信息与软件学院
来源:
关键词:
微博;
细粒度情感分析;
药物;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
【目的】对微博进行细粒度情感分析,将情感分为8类,并计算其情感强度值,从而尽可能还原微博用户情感。【方法】通过微博语料分析构建疑问词词表,在大连理工大学情感词汇本体DUTIR的7类情感基础上,丰富一类情感"疑",并利用点互信息法构建表情符号词典,还综合考虑否定词和程度副词对情感表达的影响,利用Python从新浪微博上获取数据,并用R语言的jieba R包进行分词,对情感进行分类并计算其强度。【结果】得到微博用户对于糖尿病7类常用药物的8类情感占比及情感强度,并通过正确率、召回率、F值对结果进行验证,其中"怒"和"哀"的正确率最高,分别为85.73%和83.05%,而"乐"和"好"的召回率与F值均最高,为81%以上。本文新增情感"疑"的正确率、召回率、F值分别为77.33%、78.58%、77.95%,均值在8类情感中排名前列,说明其情感识别较好。【局限】由于本文依赖于情感词典进行情感分析,因此为了更好的分析结果,情感词典仍需进一步完善。【结论】本方法具有较高的识别率和可靠性,能够更好地对微博上的情感分类进行细粒度分析。
引用
收藏
页码:61 / 72
页数:12
相关论文