基于支持向量机的文本倾向性分类研究

被引:5
作者
王素格 [1 ]
杨安娜 [1 ]
李德玉 [2 ]
魏英杰 [1 ]
李伟 [1 ]
张武 [3 ]
机构
[1] 山西大学数学科学学院
[2] 山西大学计算机与信息技术学院
[3] 上海大学计算机工程与科学学院
关键词
文本倾向性分类; 支持向量机; 特征选择; 信息增益;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.
引用
收藏
页码:421 / 425
页数:5
相关论文
共 2 条
[1]  
Peter D. Turney,Michael L. Littman.Measuring praise and criticism[J].ACM Transactions on Information Systems (TOIS),2003
[2]  
邓乃扬,田英杰著.数据挖掘中的新方法[M].北京:科学出版社,2004