一种基于XML的Web信息抽取方法

被引：22

作者：

李剑波 ^{[1
]}

李小华 ^{[1
]}

董树明 ^{[2
]}

杨科华 ^{[2
]}

机构：

[1] 湖南文理学院计算机教学部

[2] 东南大学计算机科学与工程系

来源：

情报杂志 | 2006年 / 08期

关键词：

XML; Web信息抽取; 抽取规则; 半结构化;

D O I：

暂无

中图分类号：

TP312.2 [];

学科分类号：

摘要：

目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。

引用

页码：49 / 51

页数：3

共 5 条

[1]

信息抽取的功能和实现方法 [J].