面向网络舆情分析的文本倾向性分类技术的研究与实现

被引:0
作者
谭俊武
机构
[1] 国防科学技术大学
关键词
倾向性分类; 语义资源; 文本形式化; 网络舆情;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
随着因特网在全球范围内的飞速发展,网络逐渐发展成为反映社会舆情的主要载体。当前,对网络舆论的导向进行监测和预警已经显得愈发重要。文本倾向性分类是其中的研究热点之一。文本倾向性分类是指判断一篇文章对评价对象是否具有情感倾向以及所持有的情感倾向类别。文本倾向性分类在民意调查、舆情监控、市场分析、智能导购等方面均有应用价值。 本文在研究现有各种主题分类所用技术的基础上,首先构造了中文文本倾向性分类用语义资源,并以此为基础设计实现了结合语义资源及其上下文的文本形式化方法,然后使用LIBSVM作为分类算法的实现构建了完整的文本倾向性分类器,最后通过实验验证以上成果对文本倾向性分类的改进效果,并将这些技术集成到系统平台。本文旨在通过以上研究提升舆情分析中文本的倾向性分类性能。本文主要研究内容包括如下四个方面: (1)对现有各种主题分类相关技术进行研究,分类列出了这些技术中对文本倾向性分类仍然适用的方式和方法,并总结了其中面临的主要技术瓶颈;通过列举文本倾向性分类处理对象的特点规律,总结了在构建倾向性分类器时需要着重考虑的问题和因素。 (2)针对目前倾向性语义资源匮乏的现状,收集和整理了当前主要的基础语义资源,分析了在构建语义资源时需要考虑的因素,提出了用于倾向性分类的语义资源的构建方法并实际构建了一部领域极性词典。 (3)完整构建了一个文本倾向性分类器,分类器包括了文本形式化表示和分类算法的实现两部分。为有效融入倾向性语义资源,对特征选择和特征项权重计算等文本形式化过程做了算法改进,并通过分类实验验证了分类性能的改善。 (4)以框架和应用组件的形式将UIMA与文本倾向性分类器进行了整合,为后续舆情分析系统的开发作积累和准备。
引用
收藏
页数:71
共 18 条
[1]
一个用于汉语汽车评论的意见挖掘系统.[A].姚天昉;聂青阳;李建超;李林琳;娄德成;陈珂;付宇;.中国中文信息学会二十五周年学术会议.2006,
[2]
我国突发公共事件的网络舆情研究 [D]. 
唐喜亮 .
电子科技大学,
2008
[3]
SVM在文本分类中的应用 [D]. 
叶志刚 .
哈尔滨工程大学,
2006
[4]
基于知网的话题跟踪和倾向性跟踪研究 [D]. 
金珠 .
大连理工大学,
2005
[5]
一种基于UIMA的企业级信息检索系统研究 [J].
张明宝 ;
米传民 .
情报杂志, 2009, (04) :128-132
[6]
基于UIMA的企业非结构信息资源管理系统研究 [J].
张明宝 ;
马静 .
计算机系统应用, 2008, (10) :15-19
[7]
基于语义极性分析的餐馆评论挖掘 [J].
潘宇 ;
林鸿飞 .
计算机工程, 2008, (17) :208-210
[8]
文本意见挖掘综述 [J].
姚天昉 ;
程希文 ;
徐飞玉 ;
汉思乌思克尔特 ;
王睿 .
中文信息学报, 2008, (03) :71-80
[9]
知识抽取中的停用词处理技术 [J].
化柏林 .
现代图书情报技术, 2007, (08) :48-51
[10]
知网的理论发现 [J].
董振东 ;
董强 ;
郝长伶 .
中文信息学报, 2007, (04) :3-9