基于Agent和XML的Web页面信息抽取研究与设计

被引：6

作者：

孟宪福

狄慧

机构：

[1] 大连理工大学计算机系

[2] 大连理工大学计算机系辽宁大连

[3] 辽宁大连

来源：

计算机工程与设计 | 2004年 / 08期

关键词：

Web信息抽取; Agent; XML; 抽取规则;

D O I：

10.16208/j.issn1000-7024.2004.08.059

中图分类号：

TP393.09 [];

学科分类号：

080402 ;

摘要：

在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统。在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等。另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性。

引用

页码：1411 / 1414

页数：4