网络论坛爬虫的设计

被引:2
作者
唐勇
机构
[1] 江苏省常州纺织服装职业技术学院
关键词
论坛爬虫; 网络论坛; 信息聚合;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
该文首先通过设计一种论坛爬虫程序来获取多个网络论坛中的帖子,并将这些不同格式的帖子转换成统一格式的XML文件,最后将这些XML文件转为倒排文档的索引文件,从而满足了用户对多论坛信息获取的需求。
引用
收藏
页码:570 / 572
页数:3
相关论文
共 11 条
[1]   Web服务搜索引擎的设计与实现 [J].
贺财平 ;
覃事刚 ;
刘建勋 .
计算机应用与软件, 2011, 28 (01) :44-46+117
[2]   Nutch分布式网络爬虫研究与优化 [J].
詹恒飞 ;
杨岳湘 ;
方宏 .
计算机科学与探索, 2011, 5 (01) :68-74
[3]   基于Lucene.net网络爬虫的设计与实现 [J].
刘磊安 ;
符志强 .
电脑知识与技术, 2010, 6 (08) :1870-1871+1878
[4]   垂直搜索中网页抓取技术的研究 [J].
陈哲 .
科技信息, 2009, (22) :554-554
[5]  
深层网网络爬虫设计[J]. 陈丽君.计算机与信息技术. 2009(Z2)
[6]  
深层网网络爬虫设计[J]. 陈丽君.计算机与信息技术. 2009 (Z2)
[7]   基于聚焦爬虫的手机天气预报系统 [J].
陈汶滨 ;
夏学梅 .
今日科苑, 2009, (02) :285-285
[8]   网络资源聚合方法探析 [J].
刘明辉 ;
张志平 ;
张新民 .
机械管理开发, 2008, (05) :170-172
[9]   基于ID3分类算法的深度网络爬虫设计 [J].
王舜燕 ;
李蕾 ;
吴兵华 .
现代图书情报技术, 2008, (06) :41-45
[10]   面向主题的个人实时搜索引擎的设计与实现 [J].
刘洁清 ;
吴京慧 .
现代图书情报技术, 2006, (05) :40-43