基于Rhino的JavaScript动态页面解析研究与实现

被引:19
作者
金晓鸥
钟宝燕
李翔
机构
[1] 上海交通大学信息安全工程学院
关键词
脚本解释引擎Rhino; JavaScript动态页面; 动态页面解析;
D O I
暂无
中图分类号
TP312.2 [];
学科分类号
081202 ; 0835 ;
摘要
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。
引用
收藏
页码:1 / 4+50 +50
页数:5
相关论文
共 3 条
[1]   一种新的Web链接提取模型 [J].
苏杭 ;
严建援 .
清华大学学报(自然科学版), 2006, (S1) :975-982
[2]   JavaScript引擎在动态网页采集技术中的应用 [J].
王映 ;
于满泉 ;
李盛韬 ;
王斌 ;
余智华 .
计算机应用, 2004, (02) :33-36
[3]   XML编程接口的研究与一个应用模型 [J].
柳正青 ;
刘怀亮 ;
李振坤 ;
沈芳阳 .
微机发展, 2003, (S2) :61-63+123