基于Agent和XML的Web页面信息抽取研究与设计

被引:6
作者
孟宪福
狄慧
机构
[1] 大连理工大学计算机系
[2] 大连理工大学计算机系 辽宁 大连
[3] 辽宁 大连
关键词
Web信息抽取; Agent; XML; 抽取规则;
D O I
10.16208/j.issn1000-7024.2004.08.059
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统。在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等。另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性。
引用
收藏
页码:1411 / 1414
页数:4
相关论文
共 2 条
[1]   基于DOM的Web信息提取 [J].
李效东 ;
顾毓清 .
计算机学报, 2002, (05) :526-533
[2]  
Agent和多Agent系统的设计与应用.[M].何炎祥;陈莘萌编著;.武汉大学出版社.2001,