WSAM:互联网UGC文本主观观点挖掘系统

被引:3
作者
费仲超
朱鲲鹏
魏芳
机构
[1] 上海贝尔股份有限公司
[2] 复旦大学计算机科学技术学院
关键词
用户生成内容; UGC; 自然语言处理; 情感分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
互联网上的用户生成内容UGC(User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值。设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分。分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型。挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断。算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点。实验验证,WSAM系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opin-ion Mining)等相关应用,同样也能达到较好的结果。
引用
收藏
页码:90 / 94
页数:5
相关论文
共 27 条
[21]  
Recognizing Contextual Polarity: An Exploration of Features for Phrase-Level Sentiment Analysis[J] . Theresa Wilson,Janyce Wiebe,Paul Hoffmann. &nbspComputational Linguistics . 2009 (3)
[22]  
Extracting Business Intelligencefrom Online Product Reviews:An Experiment of Automatic Rule-In-duction. Wingyan Chung,Tzu-Liang Tseng. Proceedings in ICIS . 2010
[23]  
The functional approach to the study of attitudes. Daniel Katz. Public Opinion Quarterly . 1960
[24]  
http://gate.ac.uk/ .
[25]  
Recognizing ContextualPolarity:An Exploration of Features for Phrase-level SentimentAnalysis. Wilson T,Wiebe J,Hoffmann P. Computational Linguistics . 2009
[26]  
Mining the peanut galeyr Opinion extraction and semantic classification of product reviews. Kushla Dave,Steve Lawrence,David M. Pennock. Proceedings of the international World Wide Web conference . 2003
[27]  
Intricacies of Collins’ parsing model. D. M. Bikel. Computational Linguistics . 2004