共 11 条
网络论坛爬虫的设计
被引:2
作者:
唐勇
机构:
[1] 江苏省常州纺织服装职业技术学院
来源:
关键词:
论坛爬虫;
网络论坛;
信息聚合;
D O I:
暂无
中图分类号:
TP393.092 [];
学科分类号:
摘要:
该文首先通过设计一种论坛爬虫程序来获取多个网络论坛中的帖子,并将这些不同格式的帖子转换成统一格式的XML文件,最后将这些XML文件转为倒排文档的索引文件,从而满足了用户对多论坛信息获取的需求。
引用
收藏
页码:570 / 572
页数:3
相关论文