网络论坛爬虫的设计

被引:2
作者
唐勇
机构
[1] 江苏省常州纺织服装职业技术学院
关键词
论坛爬虫; 网络论坛; 信息聚合;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
摘要
该文首先通过设计一种论坛爬虫程序来获取多个网络论坛中的帖子,并将这些不同格式的帖子转换成统一格式的XML文件,最后将这些XML文件转为倒排文档的索引文件,从而满足了用户对多论坛信息获取的需求。
引用
收藏
页码:570 / 572
页数:3
相关论文
共 11 条
[11]   面向Web的信息收集工具的设计与开发 [J].
潘春华 ;
常敏 ;
武港山 .
计算机应用研究, 2002, (06) :144-147