一种基于语义距离的Web评论SVM情感分类方法

被引:38
作者
肖正
刘辉
李兵
机构
[1] 湖南大学信息科学与工程学院
基金
湖南省自然科学基金;
关键词
文本处理; 语义距离; 情感极性分类; 潜在语义分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
情感倾向分析本质上可以看作是一个情感极性分类问题。在海量数据处理的大背景下,为了提高文本情感判断的准确率,提出了一种结合潜在语义分析LSA(Latent Semantic Analysis)和支持向量机SVM(Supported Vector Machine)的文本褒贬情感倾向分类方法。从语义的角度利用潜在语义分析方法建立"词-文档"的语义距离向量空间模型,然后使用具有良好分类精度和泛化能力的支持向量机进行情感分类。实验结果表明,该方法在句子简短、情感倾向比较明显的Web评论中的准确率较传统的SVM方法有了一定的提高,在测试集上的分类准确率接近88%。
引用
收藏
页码:248 / 252+284 +284
页数:6
相关论文
共 11 条
[1]
基于集成学习的半监督情感分类方法研究 [J].
高伟 ;
王中卿 ;
李寿山 .
中文信息学报, 2013, 27 (03) :120-126
[2]
基于句法语义的网络舆论情感倾向性评价技术研究 [J].
段建勇 ;
谢宇超 ;
张梅 .
情报杂志 , 2012, (01) :147-150
[3]
基于潜在语义分析的个性化查询扩展模型 [J].
王卫国 ;
徐炜民 .
计算机工程, 2010, 36 (21) :43-45
[4]
基于语义理解的文本情感分类方法研究 [J].
闻彬 ;
何婷婷 ;
罗乐 ;
宋乐 ;
王倩 .
计算机科学, 2010, 37 (06) :261-264
[5]
基于改进潜在语义分析的跨语言检索 [J].
宁健 ;
林鸿飞 .
中文信息学报, 2010, 24 (03) :105-111
[6]
基于HowNet的句子褒贬倾向性研究 [J].
熊德兰 ;
程菊明 ;
田胜利 .
计算机工程与应用, 2008, (22) :143-145
[7]
使用机器学习方法进行新闻的情感自动分类 [J].
徐军 ;
丁宇新 ;
王晓龙 .
中文信息学报, 2007, (06) :95-100
[8]
基于监督学习的中文情感分类技术比较研究 [J].
唐慧丰 ;
谭松波 ;
程学旗 .
中文信息学报, 2007, (06) :88-94+108
[9]
潜在语义分析理论及其应用 [J].
盖杰 ;
王怡 ;
武港山 .
计算机应用研究, 2004, (03) :9-12+20
[10]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32