基于SVM的中文微博情感识别与分类研究

被引:11
作者
刘丹丹
邱恒清
赵应丁
机构
[1] 江西农业大学计算机与信息工程学院
关键词
微博; 网络爬虫; 情感识别; 情感分类; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
微博是当下社交网络中最流行的社交工具典型代表,微博信息具有及时性,流动速度快,内容情感色彩丰富,微博的分析是对社会学、信息学、计算机科学、统计学等多学科交叉领域的研究,成为了其新的热点研究方向。鉴于自主采用Java语言开发的新浪微博的情感识别与分类系统,对中文微博的情感进行识别与分类研究。系统使用爬虫技术,抓取微博的文本内容,然后利用支持Java开发语言的ICTCLAS分词工具进行分词,去停用词,文本规范等预处理操作,再抽取情感特征,对文本情感识别与分类,最终输出分类结果。实验中通过多种方法对比,选择实验效果较好的方法,最终实验结果表明:朴素贝叶斯的主客观句识别效果优于支持向量机分类方法,基于支持向量机一对一多步识别中文微博文本情感类别效果优于一对其余一次识别方法,且准确率达到63.76%,召回率达到74.4%,总体实验结果较传统粗粒度研究有明显进步。
引用
收藏
页码:48 / 51
页数:4
相关论文
共 12 条
[1]
文本分类及其特征降维研究 [D]. 
廖一星 .
浙江大学,
2012
[2]
朴素贝叶斯分类器及其改进算法研究 [D]. 
蒋良孝 .
中国地质大学,
2009
[3]
支持向量机分类方法及其在文本分类中的应用研究 [D]. 
赵晖 .
大连理工大学,
2006
[4]
基于表情图片与情感词的中文微博情感分析 [J].
张珊 ;
于留宝 ;
胡长军 .
计算机科学, 2012, 39(S3) (S3) :146-148+176
[5]
有效的中文微博短文本倾向性分类算法 [J].
韩忠明 ;
张玉沙 ;
张慧 ;
万月亮 ;
黄今慧 .
计算机应用与软件, 2012, 29 (10) :89-93
[6]
基于层次结构的多策略中文微博情感分析和特征抽取 [J].
谢丽星 ;
周明 ;
孙茂松 .
中文信息学报, 2012, 26 (01) :73-83
[7]
基于关联分析的文本分类特征选择算法 [J].
张彪 ;
刘贵全 .
计算机工程, 2010, 36 (22) :184-186
[8]
一种基于情感词典和朴素贝叶斯的中文文本情感分类方法 [J].
杨鼎 ;
阳爱民 .
计算机应用研究, 2010, 27 (10) :3737-3739+3743
[9]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32
[10]
Web文本信息的特征获取算法 [J].
刘明吉 ;
王秀峰 ;
饶一梅 ;
黄亚楼 .
小型微型计算机系统, 2002, (06) :683-686