基于DOM和元数据的Web信息提取

被引:5
作者
刘政怡
机构
[1] 安徽大学计算机科学与信息工程学院安徽合肥
关键词
包装器; DOM; 元数据; 信息提取; 归纳学习;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
以W3C的文档对象模型DOM和元数据为基础,把要提取的信息以DOM层次结构中的路径表达式来表示,通过归纳学习来获得所需信息的路径表达式,从而获得提取信息;元数据在信息提取过程中起到关键作用,它以XML的DTD表示,可以由信息服务商提供,也可以由开发人员给出,适应了信息源不断变化的特点。
引用
收藏
页码:81 / 82+94 +94
页数:3
相关论文
共 2 条
[1]   基于DOM的Web信息提取 [J].
李效东 ;
顾毓清 .
计算机学报, 2002, (05) :526-533
[2]   基于多层模式的多记录网页信息抽取方法 [J].
朱明 ;
王军 ;
王俊普 .
计算机工程, 2001, (09) :40-42