求职网站职位列表页链接信息的自动提取

被引:3
作者
方宏 [1 ]
吕太之 [2 ]
机构
[1] 江苏海事职业技术学院信息工程系
[2] 南京理工大学计算机科学与技术学院
关键词
URL聚类; 列表页; 信息提取; 求职;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
综合运用URL聚类、JavaScript脚本解释等技术,自动识别和提取职位列表页中的职位及翻页链接。实验证明上述技术是行之有效的。
引用
收藏
页码:93 / 96
页数:4
相关论文
共 6 条
[1]   基于ID3分类算法的深度网络爬虫设计 [J].
王舜燕 ;
李蕾 ;
吴兵华 .
现代图书情报技术, 2008, (06) :41-45
[2]   基于Rhino的JavaScript动态页面解析研究与实现 [J].
金晓鸥 ;
钟宝燕 ;
李翔 .
计算机技术与发展, 2008, (02) :1-4+50
[3]   Deep Web数据集成研究综述 [J].
刘伟 ;
孟小峰 ;
孟卫一 .
计算机学报, 2007, (09) :1475-1489
[4]   基于URL结构和访问时间的Web页面访问相似性度量 [J].
李超锋 ;
卢炎生 .
计算机科学, 2007, (04) :207-209+286
[5]   WWW论坛中的动态网页采集 [J].
李魁 ;
程学旗 ;
郭岩 ;
张凯 .
计算机工程, 2007, (06) :80-82
[6]  
HtmlUnit. http://htmlunit.sourceforge.net . 2008