面向情感搜索的中文语料分析及其分词

被引:0
作者
刘浩
机构
[1] 北京邮电大学
关键词
自然语言处理; 情感搜索; 中文分词; 情感分析; 情感分类;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
主观性中文文本分析及其分词有很多研究和应用价值,情感搜索近年来引起了很多研究人员的兴趣。情感搜索是对用户在互联网上产生的主观性数据进行挖掘、分析的过程。情感搜索的研究重点主要集中在对主观性文本进行分析的过程,又叫做情感分析或意见挖掘。情感分析是对主观性文本进行挖掘与分析,获取有用的知识和信息。目前,学术界关于情感分析的技术大多是基于词的文本分析技术,分词方法性能的好坏会影响到情感分析的结果。因此分析分词方法对于情感分析的影响十分重要。 本文首先针对中文文本情感分析和中文分词的发展与研究现状进行总结.结合中文分词技术和情感分析的技术特点,利用基于词典规则的分词方法和基于语料库的统计分词方法,提出情感分词方法,建立模型,进行实验,实验结果表明该分词方法能够提升情感词的分词查准率;其次依照情感分类过程,对比阐述了四种特征抽取、三种权值计算和两种分类器的优缺点;最后根据本文情感分类的特点,建立情感分类模型,验证和测试情感分词方法带来的性能提升。文中穿插介绍了中文文本情感分析的评测和相关资源,最后总结了情感搜索分析的研究难点与未来的研究方向。
引用
收藏
页数:61
共 32 条
[1]
Estimating the sentiment of social media content for security informatics applications..[J].Kristin Glass;Richard Colbaugh.Security Informatics.2012, 1
[2]
Exploiting effective features for chinese sentiment classification [J].
Zhai, Zhongwu ;
Xu, Hua ;
Kang, Bada ;
Jia, Peifa .
EXPERT SYSTEMS WITH APPLICATIONS, 2011, 38 (08) :9139-9146
[3]
A conditional random field word segmenter for SIGHAN Bakeoff 2005..Tseng;Huihsin et al;.Proceedings of the fourth SIGHAN workshop on Chinese language processing.2005,
[4]
基于语义关联和信息增益的TFIDF改进算法研究 [J].
许珂 ;
蒙祖强 ;
林啓峰 .
计算机应用研究, 2012, 29 (02) :557-560
[5]
中文文本分类中一种基于语义的特征降维方法 [J].
胡涛 ;
刘怀亮 .
现代情报, 2011, 31 (11) :46-50
[6]
中文情感分类挖掘预处理关键技术比较研究 [J].
夏火松 ;
刘建 ;
朱慧毅 .
情报杂志, 2011, 30 (09) :160-163
[7]
Multi-Domain Sentiment Classification with Classifier Combination [J].
李寿山 ;
黄居仁 ;
宗成庆 .
Journal of Computer Science & Technology, 2011, 26 (01) :25-33
[8]
SVM文本分类中一种新的特征提取方法 [J].
姜鹤 ;
陈丽亚 .
计算机技术与发展, 2010, 20 (03) :17-19+23
[9]
一种新的情感词汇语义倾向计算方法 [J].
杜伟夫 ;
谭松波 ;
云晓春 ;
程学旗 .
计算机研究与发展, 2009, 46 (10) :1713-1720
[10]
一种改进的特征选择方法 [J].
宋志辉 .
贵州教育学院学报, 2009, 20 (06) :54-56