基于新词扩充和特征选择的微博观点句识别方法

被引:8
作者
赵洁 [1 ,2 ]
温润 [1 ]
机构
[1] 安徽大学商学院
[2] 中国科学技术大学管理学院
基金
安徽省自然科学基金;
关键词
微博; 情感分析; 观点句识别; 特征融合;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
微博情感分析已成为目前研究的热点,对于企业营销策划、产品反馈分析、舆情检测、竞争情报挖掘等具有十分重要的作用。微博情感分析通常包含观点句识别、情感要素抽取以及观点分类等一系列工作。由于情感倾向主要通过文本中的观点句来表达,因此观点句识别是影响微博情感分析效果的决定性因素。本论文针对微博观点句识别问题,提出了一种基于新词扩充和特征选择的观点句识别新方法。该方法首先基于微博表情符号和新浪微博实际数据对情感词典进行了扩充,同合并词项的方法将网络新词扩充到分词集合中以提高分词准确率,并进一步融合微博特有特征和情感词、文法、句法、主题等传统特征,使用SVM分类方法进行观点句识别。在来自腾讯微博的20个主题45 566条真实微博上的实验表明,我们的方法具有较好的准确率和F测试值。
引用
收藏
页码:945 / 951
页数:7
相关论文
共 19 条
[1]   情感分析研究综述 [J].
周立柱 ;
贺宇凯 ;
王建勇 .
计算机应用, 2008, (11) :2725-2728
[2]   话题检测与跟踪的评测及研究综述 [J].
洪宇 ;
张宇 ;
刘挺 ;
李生 .
中文信息学报, 2007, (06) :71-87
[3]   Survey on mining subjective data on the web [J].
Tsytsarau, Mikalai ;
Palpanas, Themis .
DATA MINING AND KNOWLEDGE DISCOVERY, 2012, 24 (03) :478-514
[4]   互联网商品评论情感分析研究综述 [J].
张紫琼 ;
叶强 ;
李一军 .
管理科学学报, 2010, 13 (06) :84-96
[5]  
A Sentimental Education;Sentiment Analysis using Subjectivity Summarization Based on Minimum cuts. Pan B,Lee L. Proc.of the ACL 2004 . 2004
[6]  
A Clustering-based Approach on Sentiment Analysis. Li G,Liu F. Proc Of 2010 International Conference on Intelligent Systems and Knowledge Engineering (ISKE) . 2010
[7]  
NTUSD. http://www.datatang.com/data/11837/ . 2012
[8]  
ICTCLAS. http://ictclas.org . 2012
[9]  
Libsvm. http://www.csie.ntu.edu.tw/-cjlin/libsvm/index.html . 2012
[10]  
A Study of The Classification Approach for Chinese Subjective and Objective Texts. Yao T,Peng S. Proc.of the NCIRCS 2007 . 2007