Web Robot技术及其Java实现

被引:8
作者
谭淑英
刘丽华
机构
[1] 中南大学信息科学与工程学院!湖南长沙
关键词
Robot; 机器人排斥标准; JAVA多线程; 信息搜索;
D O I
暂无
中图分类号
TP393 [计算机网络];
学科分类号
081201 ; 1201 ;
摘要
WWW环球信息呈指数级增长 ,使WWW成为全球最大的信息系统 ,研究其中的信息搜索工具具有现实意义 .WebRobot是搜索引擎中的核心部分 ,它从给定的统一资源地址开始分析 ,递归地搜索新的Web文档 .作者论述了WebRobot的工作原理以及机器人排斥标准 ,用Java实现了Web文档的下载、超链提取、新超链的可用性判断和访问站点的安全性检查 ,为提高WebRobot的效率提出了 2种解决途径 ,即采用Java多线程处理技术和集群式Robot.此外 ,给出了用Java多线程处理技术提高效率的算法 ,对网站建设和信息搜索工具的开发具有一定的参考价值 .
引用
收藏
页码:325 / 327
页数:3
相关论文
共 3 条
[1]   WebLight——一个集文档管理的综合搜索引擎 [J].
王亭 ;
赵轶群 ;
秦耕 .
计算机系统应用, 2000, (01) :22-25
[2]   集群式智能型网络信息自动搜寻与采集系统附视频 [J].
王宇 ;
张秀彬 .
上海交通大学学报, 1998, (08) :38-43
[3]  
Java语言与程序设计.[M].杨华中;贾耀炜编著;.人民邮电出版社.1997,