Web网页中动态数据区域的识别与抽取

被引:8
作者
黄健斌 [1 ]
姬红兵 [1 ]
孙鹤立 [2 ]
机构
[1] 西安电子科技大学电子工程学院
[2] 西安交通大学计算机科学与技术系
关键词
Web数据区域抽取; 动态数据区域识别; 跨网页分析;
D O I
暂无
中图分类号
TP393.092 []; TP391.1 [文字信息处理];
学科分类号
080402 ; 081203 ; 0835 ;
摘要
采用基于HTML标记树的数据块查找方法挖掘Web网页中的数据区域,在此基础上结合网页聚类和跨网页数据区域匹配自动识别一个网页中的动态数据区域。实验结果表明,该方法能够提高Web网页中动态数据区域识别的召回率和准确率。
引用
收藏
页码:53 / 55+58 +58
页数:4
相关论文
共 1 条
[1]   基于网页结构树的Web信息抽取方法 [J].
陈琼 ;
苏文健 .
计算机工程, 2005, (20) :54-55+140