文本倾向性分析在舆情监控系统中的应用研究

被引:0
作者
张超
机构
[1] 北京邮电大学
关键词
倾向性分析; 舆情; 极性话题; 焦点话题; 敏感话题;
D O I
暂无
年度学位
2008
学位类型
硕士
导师
摘要
舆情指在一定的社会空间内,围绕中介性社会事项的发生、发展和变化,作为主体的民众对作为客体的国家管理者产生和持有的社会政治态度。随着网络的普及,网络舆情以“舆论多元”为最大特点,网络舆情的信息丰度呈现“爆炸”的态势,一是网络舆情信息的数量极为庞大,二是其类别繁多,三是背景信息复杂,尤其是突发事件和社会流行事件,常常会立即引发各种社会集团、政治势力的共同关注。在这种情况下,要人工去甄别每个意见的具体情况并加以分类统计是不现实的。只有采用计算机技术自动地对网络舆情语料进行分析整理,才能够建立起全面、有效、快速的舆情监控预警机制。 传统的网络舆情监控系统中,话题发现方法多采用聚类基础上考察相关评论规模的方法,往往对网民评论的情感因素关注不足,而且通常是停留在热点话题发现的程度,没有进一步根据倾向性特性进行区分。近年来,虽然有学者对舆情的特性进行了深度分析的研究,给出了一些舆情关键点的定义,但是没有给出具体的数学模型,也没有提出可行的发现方案,发现方法多是手工采集整理。本文尝试将自然语言理解技术中的文本倾向性分析技术引入舆情监控系统之中,对文本倾向性分析技术在舆情监控系统中的应用进行了研究。本文首先对引入文本倾向性分析技术的舆情监控系统进行了整体设计,并详细设计了各主要模块;在建立词语倾向性词典的基础上,研究了多种网络评论倾向性分析方案的优缺点,分析比较了多种段落评论分析方案;最后在对主题文章进行聚类的基础上,根据参与评论的网民规模发现其中的热点话题,建立包含网民倾向性因素的极性话题、焦点话题、敏感话题发现模型,以提高舆情监控系统的实用价值。
引用
收藏
页数:63
共 27 条
[1]
网络舆情及其分析技术.[N].马海兵;.光明日报.2007,
[2]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
[3]
教你使用数据挖掘工具Weka [J].
王学辉 ;
王兴鹏 .
电脑学习, 2007, (05) :48
[4]
汉语语句主题语义倾向分析方法的研究 [J].
姚天昉 ;
娄德成 .
中文信息学报, 2007, (05) :73-79
[5]
基于语义理解的文本倾向性识别机制 [J].
徐琳宏 ;
林鸿飞 ;
杨志豪 .
中文信息学报, 2007, (01) :96-100
[6]
汉语句子语义极性分析和观点抽取方法的研究 [J].
娄德成 ;
姚天昉 .
计算机应用, 2006, (11) :2622-2625
[7]
互联网内容及舆情深度分析模式 [J].
谢海光 ;
陈中润 .
中国青年政治学院学报, 2006, (03) :95-100
[8]
VSM在中文文本聚类中的应用及实证分析 [J].
马辉民 ;
李卫华 ;
吴良元 .
武汉理工大学学报(信息与管理工程版), 2006, (04) :56-59+81
[9]
基于HowNet的词汇语义倾向计算 [J].
朱嫣岚 ;
闵锦 ;
周雅倩 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (01) :14-20
[10]
网络舆情:现代思想政治教育的新领域 [J].
周如俊 ;
王天琪 .
思想·理论·教育, 2005, (11) :12-15+29