基于非完备信息系统的评价对象情感聚类

被引:2
作者
王素格 [1 ,2 ]
尹学倩 [3 ]
李茹 [1 ,2 ]
张杰 [3 ]
吕云云 [1 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 山西大学计算智能与中文信息处理教育部重点实验室
[3] 山西大学数学科学学院
关键词
非完备信息系统; 评价对象; 本体; 特征降维; 聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
该文利用领域本体对产品评论文本中的评价对象进行抽取和整合,在此基础上,建立产品性能的非完备信息系统,将特征的情感倾向寓于特征的权重计算之中。对非完备信息系统,给出了基于差别矩阵的启发式特征约简方法,通过特征降维处理,达到了减少特征的冗余度和数据稀疏性的目的。对降维后的非完备信息系统采用K-Means聚类算法,实现了评价对象情感聚类。为了验证该文提出方法的有效性,在真实汽车评论文本数据上进行实验,实验结果表明,在对特征进行一定程度的降维后,仍表现出较好的聚类效果。
引用
收藏
页码:98 / 102+108 +108
页数:6
相关论文
共 14 条
[1]  
Mining and summarizing customer reviews. Minqing Hu,Bing Liu. Proceedings of the 10th ACM SIGKDD international conference on Knowledge discovery and data mining . 2004
[2]  
Measuring praise and criticism[J] . Peter D. Turney,Michael L. Littman. &nbspACM Transactions on Information Systems (TOIS) . 2003 (4)
[3]  
粗糙集理论与方法[M]. 科学出版社 , 张文修等编著, 2001
[4]   文档聚类综述 [J].
刘远超 ;
王晓龙 ;
徐志明 ;
关毅 .
中文信息学报, 2006, (03) :55-62
[5]   改进的基于差别矩阵的属性约简算法 [J].
王加阳 ;
高灿 .
计算机工程, 2009, 35 (03) :66-67+73
[6]   基于汉语情感词表的句子情感倾向分类研究 [J].
王素格 ;
杨安娜 ;
李德玉 .
计算机工程与应用 , 2009, (24) :153-155+161
[7]   面向观点挖掘的汽车评价本体知识库的构建 [J].
冯淑芳 ;
王素格 .
计算机应用与软件, 2011, 28 (05) :45-47+105
[8]  
Measuring praise and criticism: inference of semantic orientation from association. Turney,Peter,Littman Michael. ACM Transactions on Information Systems . 2003
[9]  
Contextual lexical valenceshifters. L.Polanyi,A.Zaenen. Proceedings of the AAAI Spring Sym-posium on Exploring Attitude and Affect in Text . 2004
[10]  
Extracting product fea-tures and opinions from reviews. A.M.Popescu,O.Etzioni. Proceedings ofthe Human Language Technology Conference and theConference on Empirical Methods in Natural LanguageProcessing(HLT/EMNLP) . 2005