共 8 条
网络爬虫在Web信息搜索与数据挖掘中应用
被引:39
作者:
杨定中
[1
,2
]
赵刚
[1
,2
]
王泰
[1
]
机构:
[1] 华中师范大学教育部教育信息技术工程研究中心
[2] 华中师范大学信息技术系
来源:
关键词:
Web搜索;
Web挖掘;
网络爬虫;
体系结构;
应用;
D O I:
10.16208/j.issn1000-7024.2009.24.010
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
分析了万维网不良网络信息对网络文化安全带来的挑战,提出了Web信息搜索与数据挖掘体系结构,并介绍了该体系结构中的关键技术和运行原理。分析了普通爬虫所实现的功能和不足之后,重点论述了该爬虫的工作原理、实现方式和性能分析以及该爬虫不同于其它爬虫的功能和在Web信息搜索与数据挖掘体系中应用。通过试验测试表明,该爬虫能够很好地获取万维网上的各种信息资源,有助于网络文化内容监测与管理。
引用
收藏
页码:5658 / 5662
页数:5
相关论文