BBS热点分析系统研究

被引:0
作者
周旭
机构
[1] 北京交通大学
关键词
搜索引擎; 网络爬虫; BBS; 热点分析;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
BBS,即电子公告栏,是目前大众尤其是大学生钟爱的交流方式和言论重地。由于可以发表平时不敢说的言论,BBS成为了社会热点问题和学校焦点问题的发散地。但它的缺点是人们可以利用它匿名的特点发表不负责任的言论确相安无事,而且很多时候社会上的主流观点却成为了人们批判和抨击的对象。因此对BBS上的言论进行正确的舆论导向是一样很重要的工作。 网络爬虫是伴随着搜索引擎的诞生而出现的,是一个自动提取网页的程序,它为搜索引擎在Web上下载网页,是搜索引擎的关键组成部分。由于Web信息的爆炸式增长,人们获取网络信息的方式也越来越依靠搜索引擎,因此对网络爬虫的要求也越来越高。现在比较常用的几种爬虫有:聚焦爬虫、个性爬虫、分布式爬虫、主题爬虫等。 利用爬虫可以自动从网上不间断获取数据的特性,我们对某高校BBS进行大量的数据获取,对主题行为进行了详细研究,通过Matlab仿真和C#代码实现,根据现有信息预测未来主题的回帖情况,对每个帖子的未来走势进行科学预测和热点分析,从而起到协助学校BBS舆论导向的作用。 本文主要介绍网络爬虫产生和发展,各种网络爬虫的特点,重点介绍了主题爬虫的工作原理,并介绍了在此基础之上开发的热点分析系统的设计和实现。
引用
收藏
页数:63
共 9 条
[1]
深入浅出Oracle.[M].盖国强著;.人民邮电出版社.2006,
[2]
精通正则表达式.[M].(美) 弗里德尔 (Friedl;E.F.) ; 著.东南大学出版社.2005,
[3]
MD5加密算法在Web程序中的应用 [J].
刘洪涛 .
科技咨询导报, 2006, (08) :191-192
[4]
主题搜索ROBOT综合爬行策略的研究 [J].
吴安清 ;
张颖江 ;
涂军 .
武汉理工大学学报, 2006, (02) :74-76
[5]
面向主题Crawler的设计与实现 [J].
苗长芬 ;
冯伟华 .
平原大学学报, 2005, (03) :110-112
[6]
正确把握高校BBS舆论导向的原则 [J].
王和平 .
辽宁高职学报, 2005, (02) :149-151
[7]
主题爬虫的解决方案 [J].
刘林 ;
汪涛 ;
樊孝忠 .
华南理工大学学报(自然科学版), 2004, (自然科学版) :137-141
[8]
个性化智能搜索引擎爬行虫算法 [J].
齐冬梅 ;
杜亚军 ;
李战胜 .
计算机应用, 2004, (S2) :179-182
[9]
基于概念分析的主题爬虫设计 [J].
汪涛 ;
樊孝忠 ;
顾益军 ;
刘林 .
北京理工大学学报, 2004, (10) :890-893