学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于Java的多线程网络爬虫设计与实现
被引:7
作者
:
论文数:
引用数:
h-index:
机构:
姜梦稚
机构
:
[1]
上海电机学院电子信息学院
来源
:
微型电脑应用
|
2010年
/ 26卷
/ 07期
关键词
:
网络爬虫;
链接检索;
文字匹配;
爬虫设计;
多线程;
D O I
:
暂无
中图分类号
:
TP391.3 [检索机];
学科分类号
:
摘要
:
网络爬虫是目前比较流行的一种网页检索工具,其设计和实现也需要不断优化和改进。通过描述网络爬虫设计与实现中所碰到的问题,提供解决这些问题的方法,并给出实现这些目标的网络爬虫设计方法,提供该设计的Java语言版实现。
引用
收藏
页码:21 / 22+4 +4-5
页数:4
相关论文
共 3 条
[1]
用有向图法解决网页爬行中循环链接问题
论文数:
引用数:
h-index:
机构:
赫枫龄
左万利
论文数:
0
引用数:
0
h-index:
0
机构:
吉林大学计算机科学与技术学院
左万利
[J].
吉林大学学报(理学版),
2004,
(03)
: 402
-
404
[2]
基于标记树对象抽取技术的Hidden Web获取研究
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
宋晖
张岭
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
张岭
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
叶允明
马范援
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
马范援
不详
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
不详
[J].
计算机工程与应用 ,
2002,
(23)
: 9
-
12+24
[3]
Java编程思想[M]. 机械工业出版社 , (美)BruceEckel著, 2005
←
1
→
共 3 条
[1]
用有向图法解决网页爬行中循环链接问题
论文数:
引用数:
h-index:
机构:
赫枫龄
左万利
论文数:
0
引用数:
0
h-index:
0
机构:
吉林大学计算机科学与技术学院
左万利
[J].
吉林大学学报(理学版),
2004,
(03)
: 402
-
404
[2]
基于标记树对象抽取技术的Hidden Web获取研究
宋晖
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
宋晖
张岭
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
张岭
叶允明
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
叶允明
马范援
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
马范援
不详
论文数:
0
引用数:
0
h-index:
0
机构:
上海交通大学计算机系
不详
[J].
计算机工程与应用 ,
2002,
(23)
: 9
-
12+24
[3]
Java编程思想[M]. 机械工业出版社 , (美)BruceEckel著, 2005
←
1
→