WSAM:互联网UGC文本主观观点挖掘系统

被引:3
作者
费仲超
朱鲲鹏
魏芳
机构
[1] 上海贝尔股份有限公司
[2] 复旦大学计算机科学技术学院
关键词
用户生成内容; UGC; 自然语言处理; 情感分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
互联网上的用户生成内容UGC(User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值。设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分。分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型。挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断。算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点。实验验证,WSAM系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opin-ion Mining)等相关应用,同样也能达到较好的结果。
引用
收藏
页码:90 / 94
页数:5
相关论文
共 27 条
[1]   Blog研究 [J].
杨宇航 ;
赵铁军 ;
于浩 ;
郑德权 .
软件学报, 2008, (04) :912-924
[2]  
" Exploring Consumer Motivations for Creating User-Generated Content". Terry Daugherty,,Matthew S. Eastin,Laura Bright. journal of Interactive Advertising . 2008
[3]  
现代汉语知识辞典[M]. 四川人民出版社 , 张清源等编, 1990
[4]  
Phrase dependency parsing for opinion mining. WU Yuan-bin,ZHANG Qi,HUANG Xuan-jing. Proceedings ofthe Conference on Empirical Methods in Natural Language Processing (EMNLP2009) . 2009
[5]  
Mining the Relation be-tween Sentiment Expression and Target Using Dependency of Words. Zhongchao Fei,Xuanjing Huang,Lide Wu. PACLIC20 . 2006
[6]  
Language,gender and sexuality:Do bodies al-ways matter?Department of Linguistics,Cornell University InvitedTalks. Sally McConnell-Ginet. ACL 2006 .
[7]  
http://nlp.stanford.edu/software/stanford-parser-2010-11-30.tgz .
[8]  
http://www.research.ibm.com/UIMA/ .
[9]  
http://www.keenage.com/download/sentiment.rar .
[10]   文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848