基于语义技术的中文信息情感分析方法研究

被引:0
作者
林斌
机构
[1] 哈尔滨工业大学
关键词
语义倾向; 中文信息情感分析; 评价文本分类; 语义分析方法;
D O I
暂无
年度学位
2006
学位类型
硕士
导师
摘要
面对网络上日益丰富的情感信息资源,如何能快速有效的获取并使用其中的有效信息成为人们关注的问题。本论文以影评信息领域的客户情感挖掘为例,通过使用一种以语义倾向分析为基础的信息挖掘技术来挖掘影评中用户透露的情感信息,藉此探讨语义倾向分析方法在面向互联网中文信息的客户情感分析中的作用。 本文首先系统地介绍了文本分类的相关知识。通过对文本分类的基本概念、原理及相关技术的介绍,总结了文本分类领域的研究现状,为下一步方法的提出奠定基础。 随后论文对语义分析的来源及原理作了简要地总结,从中英文语言差异的角度出发,针对语义倾向方法在英文应用中暴露的问题,提出了改进,进而提出应用于中文的改进算法。 最后的实验阶段论文运用影评测试文档对改进后的文档进行实测以验证改进后算法的正确性。为了验证改进后算法每个步骤的必要性,论文针对不同的步骤组合也进行了相关的实验。同时更加清晰地展现改进后算法的性能,验证改进的正确性,本文运用近年来广泛使用支持向量机技术进行性能的比较,并采用手机测试文档进一步测试比较两者的性能。 本文在改进算法的同时,收集整理了相关的影评数据集和手机数据集,形成了一个可以共享的语料库。同时根据改进后的算法,设计编写了一个情感信息分类系统,解决了中文情感信息的自动分类问题。 语义倾向方法与训练型的文本分类算法相比,由于具有不需要大量样本训练、领域知识依赖弱的特点,相信在未来必能得到广泛的发展。
引用
收藏
页数:71
共 25 条
[1]
融合聚类触发对特征的最大熵词性标注模型 [J].
赵岩 ;
王晓龙 ;
刘秉权 ;
关毅 .
计算机研究与发展, 2006, (02) :268-274
[2]
基于知网的语义相关度计算 [J].
许云 ;
樊孝忠 ;
张锋 .
北京理工大学学报, 2005, (05) :411-414
[3]
知网在词语相似度计算方面的应用 [J].
易丽萍 ;
竹勇 ;
雷小春 .
信息技术与信息化, 2005, (01) :24-26
[4]
中文文本分类的特征选取评价 [J].
孙国菊 ;
张杰 .
哈尔滨理工大学学报, 2005, (01) :76-78
[5]
知网与同义词词林的信息融合研究 [J].
梅立军 ;
周强 ;
臧路 ;
陈祖舜 .
中文信息学报, 2005, (01) :63-70
[6]
基于SVM的多类文本分类研究 [J].
张爱丽 ;
刘广利 ;
刘长宇 .
情报杂志, 2004, (09) :6-7+10
[7]
基于SVM的中文文本分类反馈学习技术的研究 [J].
孙晋文 ;
肖建国 ;
不详 .
控制与决策 , 2004, (08) :927-930
[8]
基于知网的概念特征抽取方法 [J].
赵林 ;
胡恬 ;
黄萱菁 ;
吴立德 ;
不详 .
通信学报 , 2004, (07) :46-54
[9]
不同程度的监督机制在自动文本分类中的应用 [J].
丁磊 ;
钱云涛 .
计算机应用与软件, 2004, (06) :65-68
[10]
基于词关联语义的文本分类研究 [J].
党齐民 ;
吕冬煜 .
计算机应用, 2004, (04) :62-63+66