基于扩展词典与语义规则的中文微博情感分析

被引:13
作者
李继东
王移芝
机构
[1] 北京交通大学计算机与信息技术学院
关键词
微博; 情感分析; 情感词典; 语义规则;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP393.092 [];
学科分类号
摘要
首先分析微博文本新词出现规律,通过程度词发现微博新词,然后通过拓展的PMI算法,计算新词与情感基准词之间的点互信息值,根据点互信息值将新词分为褒贬2类后加入微博领域词典。接着构建基础情感词典,考虑到微博文本的独特性和汉语言特点,构建微博表情词典、否定词典、程度词词典、连词词典。最后结合情感词典与语义规则,通过与微博表情进行情感值加权的方式来对中文微博进行情感分析。通过对抓取的微博数据集进行测试,验证了本文提出的分析策略的有效性。
引用
收藏
页码:89 / 95
页数:7
相关论文
共 13 条