网络舆情监控的热点发现算法研究

被引:0
作者
郑军
机构
[1] 哈尔滨工程大学
关键词
信息安全; 网络舆情; 文木挖掘; 向量空间模型;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
在当前的社会环境和Internet网络环境日趋复杂的条件下,网络舆情已经对社会的稳定和众多上网的人们产生了重大的影响。网络舆情与一般的舆情不同,它发生的范围广,传播的速度快,并且舆情的爆发点具有不易发现和控制等特点,这使得对网络中舆情的有效的发现与监控变得非常重要。 本文从WEB舆情监控与上报系统的设计和实现技术入手,深入分析了一个有效的舆情监控系统的系统架构的设计和基本处理流程的安排等方面的问题。在本文中,分别介绍了WEB舆情监控与上报系统中的,舆情信息收集模块、信息预处理模块以及热点发现与跟踪模块的设计和实现过程中所采用的多种技术。本文的最后通过实验的方法比较了热点发现以及事件跟踪功能中所使用的多种文本分类、文本聚类算法,证明了热点发现与跟踪模块设计的合理性和必要性。 本文针对网络舆情的监控设计了一个WEB舆情监控与上报系统,为使得网络环境能够健康有序地发展做出了自己的贡献。 综合起来本文的主要工作如下: (1)结合当前国内外各种相关技术,设计了WEB舆情监控与上报系统的整体架构; (2)分析了系统中两个重要的辅助模块:舆情信息收集模块和信息预处理模块的设计和实现的方法; (3)重点介绍了系统的核心功能模块——热点发现与跟踪模块的设计和实现的方法; (4)比较了热点发现和事件跟踪算法中所用到的数据挖掘算法的优缺点; (5)通过实验的数据证明了系统设计中系统架构的优越性。
引用
收藏
页数:66
共 19 条
[1]
基于文本分类TFIDF方法的改进与应用 [J].
张玉芳 ;
彭时名 ;
吕佳 .
计算机工程, 2006, (19) :76-78
[2]
基于TFIDF的文本特征选择方法 [J].
柴玉梅 ;
王宇 .
微计算机信息, 2006, (24) :24-26
[3]
SOM神经网络算法的研究与进展 [J].
杨占华 ;
杨燕 .
计算机工程, 2006, (16) :201-202+228
[4]
文档聚类综述 [J].
刘远超 ;
王晓龙 ;
徐志明 ;
关毅 .
中文信息学报, 2006, (03) :55-62
[5]
基于改进KNN的文本分类方法 [J].
钱晓东 ;
王正欧 ;
不详 .
情报科学 , 2005, (04) :550-554
[6]
Web网页并行爬行研究 [J].
严亚兰 ;
查先进 .
计算机应用研究, 2005, (04) :226-228+241
[7]
元搜索引擎的原理与设计 [J].
郭少友 .
情报科学 , 2005, (02) :245-248
[8]
基于关联特征的朴素贝叶斯文本分类器 [J].
张阳 ;
张利军 ;
闫剑锋 ;
李战怀 .
西北工业大学学报, 2004, (04) :413-416
[9]
支持向量机及其应用研究综述 [J].
祁亨年 .
计算机工程, 2004, (10) :6-9
[10]
中文文本分类中特征抽取方法的比较研究 [J].
代六玲 ;
黄河燕 ;
陈肇雄 .
中文信息学报, 2004, (01) :26-32