基于词向量的跨领域中文情感词典构建方法

被引:15
作者
冯超
梁循
李亚平
周小平
李晓菲
机构
[1] 中国人民大学信息学院
基金
北京市自然科学基金;
关键词
情感分析; 情感词典; 词向量; 跨领域;
D O I
10.16337/j.1004-9037.2017.03.017
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
情感分析已经成为当今自然语言处理领域的热点问题。对于文本的自动化、半监督式的情感分析研究具有广泛的理论和实用价值。基于情感词典的情感倾向分析方法是文本情感分析的一种重要手段。然而,中文词汇在不同领域中的情感倾向不尽相同,一词多义现象明显。同时,不同领域中的情感词也具有专业性、领域性的特点。针对这些问题,本文提出一种基于词向量相似度的半监督情感极性判断算法(Sentiment orientation from word vector,SO-WV),并依据该算法设计出一种跨领域的中文情感词典构建方法。实验证明,本文所设计的情感词典构建方法能有效地对情感词情感倾向进行判断。算法不仅在不同领域的情感词典建立上具有良好的可移植性,同时还具有专业性、领域性的特点。
引用
收藏
页码:579 / 587
页数:9
相关论文
共 4 条
[1]   针对有向图的局部扩展的重叠社区发现算法 [J].
张海燕 ;
梁循 ;
周小平 .
数据采集与处理, 2015, 30 (03) :683-693
[2]   基于词亲和度的微博词语语义倾向识别算法 [J].
唐浩浩 ;
王波 ;
周杰 ;
陈东 ;
刘绍毓 .
数据采集与处理, 2015, 30 (01) :137-147
[3]   基于双语信息和标签传播算法的中文情感词典构建方法 [J].
李寿山 ;
李逸薇 ;
黄居仁 ;
苏艳 .
中文信息学报, 2013, (06) :75-81
[4]  
Thumbs up or thumbs down?Semantic orientation applied to unsupervised classification of reviews .2 Turney P. Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL) . 2002