一种基于语义距离的Web评论SVM情感分类方法

被引：38

作者：

肖正

刘辉

李兵

机构：

[1] 湖南大学信息科学与工程学院

来源：

计算机科学 | 2014年 / 41卷 / 09期

基金：

湖南省自然科学基金;

关键词：

文本处理; 语义距离; 情感极性分类; 潜在语义分析;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

情感倾向分析本质上可以看作是一个情感极性分类问题。在海量数据处理的大背景下,为了提高文本情感判断的准确率,提出了一种结合潜在语义分析LSA(Latent Semantic Analysis)和支持向量机SVM(Supported Vector Machine)的文本褒贬情感倾向分类方法。从语义的角度利用潜在语义分析方法建立"词-文档"的语义距离向量空间模型,然后使用具有良好分类精度和泛化能力的支持向量机进行情感分类。实验结果表明,该方法在句子简短、情感倾向比较明显的Web评论中的准确率较传统的SVM方法有了一定的提高,在测试集上的分类准确率接近88%。

引用

页码：248 / 252+284 +284

页数：6

共 11 条

[1]

基于集成学习的半监督情感分类方法研究 [J].