有效的中文微博短文本倾向性分类算法

被引:99
作者
韩忠明
张玉沙
张慧
万月亮
黄今慧
机构
[1] 北京工商大学计算机与信息工程学院
关键词
倾向性; 情感; 词典; 自动机; 知网; 支持向量机;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
对具有长度短、结构复杂以及变形词多等特点的短文本倾向性分类进行深入研究,目的是提高倾向性分类的准确性和效率。以HowNet的情感词典为基础,提出一个微博新词发现算法,构建微博情感词典。在对文本进行分句、分词、标注、情感处理等后,构建一个自动机来计算短文本情感倾向性。为了客观评价该方法,选择基于HowNet的分类方法、基于SVM的分类方法进行比较性实验。实验结果表明提出的方法在一般文本分类上与SVM效果类似,在短文本上则具有明显的优势。同时该方法在效率上也具有突出优势。
引用
收藏
页码:89 / 93
页数:5
相关论文
共 8 条
[1]
Exploiting effective features for chinese sentiment classification [J].
Zhai, Zhongwu ;
Xu, Hua ;
Kang, Bada ;
Jia, Peifa .
EXPERT SYSTEMS WITH APPLICATIONS, 2011, 38 (08) :9139-9146
[2]
基于语义理解的中文博文倾向性分析 [J].
何凤英 .
计算机应用, 2011, 31 (08) :2130-2133+2137
[3]
网络评论倾向性分析 [J].
丁建立 ;
慈祥 ;
黄剑雄 .
计算机应用, 2010, 30 (11) :2937-2940
[4]
新闻报道文本的情感倾向性研究 [J].
昝红英 ;
郭明 ;
柴玉梅 ;
吴云芳 .
计算机工程, 2010, 36 (15) :20-22
[5]
基于情感词典扩展技术的网络舆情倾向性分析 [J].
杨超 ;
冯时 ;
王大玲 ;
杨楠 ;
于戈 .
小型微型计算机系统, 2010, 31 (04) :691-695
[6]
基于支持向量机的文本倾向性分类研究 [J].
王素格 ;
杨安娜 ;
李德玉 ;
魏英杰 ;
李伟 ;
张武 .
中北大学学报(自然科学版), 2008, (05) :421-425
[7]
基于监督学习的中文情感分类技术比较研究 [J].
唐慧丰 ;
谭松波 ;
程学旗 .
中文信息学报, 2007, (06) :88-94+108
[8]
基于多重冗余标记CRFs的句子情感分析研究 [J].
王根 ;
赵军 .
中文信息学报, 2007, (05) :51-55+86