基于多层次语言特征的弱监督评论倾向性分析

被引:3
作者
牛耘
张黎
王世泓
魏欧
机构
[1] 南京航空航天大学计算机科学与技术学院
关键词
情感分析; 多层次语言特征; 弱监督算法; 情感词典;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文提出一种基于多层次语言特征的弱监督的情感分析方法,先以少量情感词构成初始情感词典,用这些种子词汇作引导,根据评论文本在单词、短语及句子级别的语言特征结合上下文挖掘目标文本中潜在的具有情感倾向的词汇/短语。通过自训练不断扩充情感词典,最终得到一个具有领域特征的情感词典,并用所得到的情感词典对目标文本的情感倾向进行判断。与其他方法在同一数据上的结果相比,该方法以很小的词典规模取得了最高的F-score,并且得到的情感词含义明确。方法用于不同领域也取得了较高的精度,表明方法具有较好的领域适应性。
引用
收藏
页码:80 / 88
页数:9
相关论文
共 18 条
[1]   基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, (01) :73-83
[2]   基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429
[3]   不平衡情感分类中的特征选择方法研究 [J].
王志昊 ;
王中卿 ;
李寿山 ;
李培峰 .
中文信息学报, 2013, 27 (04) :113-118
[4]   中文博客多方面话题情感分析研究 [J].
傅向华 ;
刘国 ;
郭岩岩 ;
郭武彪 .
中文信息学报, 2013, 27 (01) :47-55
[5]  
Self-training from labeled features for sentiment analysis[J] . Yulan He,Deyu Zhou. &nbspInformation Processing and Management . 2010 (4)
[6]  
Recognizing subjectivity: a case study in manual tagging. Rebecca F. Bruce,Janyce M. Wiebe. Natural Language Engineering . 1999
[7]  
Towards answering opinion questions: separating facts from opinions and identifying the polarity of opinion sentences. Yu Hong,Vasileios Hatzivassiloglou. Proceedings of the 2003 conference on Empirical methods in natural language processing (EMNLP-2003) . 2003
[8]  
Thumbs up or thumbs down?semanticorientation applied to unsupervised classification of re-views. TURNEY P D. Proceeding of Association for Computation-al Linguistics 40th Anniversary Meeting . 2002
[9]  
Automatic Seed Word Selection for Unsupervised Sentiment Classification of Chinese Text. Taras Zagibalov,John Carroll. Coling’’’’’’’’08 . 2008
[10]  
Unsupervised Classification of Sentiment andObjectivity in Chinese Text. Taras Zagibalov,John Carroll. IJCNLP’’’’’’’’08 . 2008