基于双语词典的微博多类情感分析方法

被引:33
作者
栗雨晴 [1 ,2 ]
礼欣 [1 ,2 ]
韩煦 [1 ]
宋丹丹 [1 ,2 ]
廖乐健 [1 ,2 ]
机构
[1] 北京理工大学计算机学院
[2] 北京市海量语言信息处理与云计算应用工程技术研究中心
关键词
双语语义倾向性分析; 半监督高斯混合模型; 相对熵; 情感词典;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
现有微博文本情感分析方法多面向单一语种语料,如:中文语料.但是,中英文搭配使用的表达习惯已逐渐成为个体意见表达的重要形式.本文提出一种基于双语词典的多类情感分析方法,通过构建双语多类情感词典对微博文本进行多分类语义倾向性分析,以便更准确有效捕捉群体意见,及时发现社会舆论倾向.通过与多数投票算法、支持向量机算法、基于余弦距离的K近邻分类算法相比,本文提出的基于双语词典的多类情感分析模型具有良好的分类效果,其在分类准确率、F1值等方面都有明显提高.
引用
收藏
页码:2068 / 2073
页数:6
相关论文
共 2 条
  • [1] 基于HowNet的词汇语义倾向计算
    朱嫣岚
    闵锦
    周雅倩
    黄萱菁
    吴立德
    [J]. 中文信息学报, 2006, (01) : 14 - 20
  • [2] WordNet[J] . George A. Miller.Communications of the ACM . 1995 (11)