基于表情符的社交网络情绪词典构造

被引:14
作者
马秉楠
黄永峰
邓北星
机构
[1] 清华大学电子工程系
基金
国家自然科学基金重点项目;
关键词
新浪微博; 情绪分类; 情绪词典; 自然语言处理; 舆情分析;
D O I
10.16208/j.issn1000-7024.2016.05.003
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在新浪微博发表的内容没有固定主题于领域、用词网络化、包含大量的情感符号以及口语表达,这些与传统文本有很大区别,因此传统的情感词典并不适用于社交网络短文本环境,对此提出一种基于社交网络中特殊情感符号的跨媒体多情绪(喜怒哀乐)情感词典构建方法。将图片与短文本内容相结合,通过表情符与文本词之间的互信息的计算,筛选基于社交网络的情绪词典。将该词典与已有的情感词典进行对比,对比结果表明,在社交网络环境中,该词典覆盖率达到84.23%,对于4种不同情绪的分类准确率达到73.71%,明显优于已有词典。
引用
收藏
页码:1129 / 1133
页数:5
相关论文
共 2 条
  • [1] 情感词汇本体的构造[J]. 徐琳宏,林鸿飞,潘宇,任惠,陈建美.情报学报. 2008 (02)
  • [2] Twitter mood predicts the stock market
    Bollen, Johan
    Mao, Huina
    Zeng, Xiaojun
    [J]. JOURNAL OF COMPUTATIONAL SCIENCE, 2011, 2 (01) : 1 - 8