共 2 条
基于DOM和元数据的Web信息提取
被引:5
作者:
刘政怡
机构:
[1] 安徽大学计算机科学与信息工程学院安徽合肥
来源:
关键词:
包装器;
DOM;
元数据;
信息提取;
归纳学习;
D O I:
暂无
中图分类号:
TP393.092 [];
学科分类号:
080402 ;
摘要:
以W3C的文档对象模型DOM和元数据为基础,把要提取的信息以DOM层次结构中的路径表达式来表示,通过归纳学习来获得所需信息的路径表达式,从而获得提取信息;元数据在信息提取过程中起到关键作用,它以XML的DTD表示,可以由信息服务商提供,也可以由开发人员给出,适应了信息源不断变化的特点。
引用
收藏
页码:81 / 82+94
+94
页数:3
相关论文