基于赋权粗糙隶属度的文本情感分类方法

被引:18
作者
王素格 [1 ,2 ]
李德玉 [1 ,2 ]
魏英杰 [3 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 计算智能与中文信息处理教育部重点实验室(山西大学)
[3] 科学出版社
基金
高等学校博士学科点专项科研基金;
关键词
文本情感分类; 文本表示; 情感倾向强度; 离散化; 粗糙隶属度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能.
引用
收藏
页码:855 / 861
页数:7
相关论文
共 9 条
[1]   一种新的情感词汇语义倾向计算方法 [J].
杜伟夫 ;
谭松波 ;
云晓春 ;
程学旗 .
计算机研究与发展, 2009, 46 (10) :1713-1720
[2]   基于概率推理模型的博客倾向性检索研究 [J].
廖祥文 ;
曹冬林 ;
方滨兴 ;
许洪波 ;
程学旗 .
计算机研究与发展, 2009, 46 (09) :1530-1536
[3]   基于同义词的词汇情感倾向判别方法 [J].
王素格 ;
李德玉 ;
魏英杰 ;
宋晓雷 .
中文信息学报, 2009, (05) :68-74
[4]   基于汉语情感词表的句子情感倾向分类研究 [J].
王素格 ;
杨安娜 ;
李德玉 .
计算机工程与应用 , 2009, (24) :153-155+161
[5]   使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[6]   基于语言建模的文本情感分类研究 [J].
胡熠 ;
陆汝占 ;
李学宁 ;
段建勇 ;
陈玉泉 .
计算机研究与发展, 2007, (09) :1469-1475
[7]  
Measuring praise and criticism[J] . Peter D. Turney,Michael L. Littman.ACM Transactions on Information Systems (TOIS) . 2003 (4)
[8]   Rough set-aided keyword reduction for text categorization [J].
Chouchoulas, A ;
Shen, Q .
APPLIED ARTIFICIAL INTELLIGENCE, 2001, 15 (09) :843-873
[9]  
A rough set-based hybrid method to text categorization. BAO Yong-guang,AOYAMA S,YAMADA K,et al. Proceedings of the Second International Conference on Web Information Systems Engineering . 2001