基于HTML或MXL描述的Web页信息抽取技术研究

被引：2

作者：

谢维成

吕先竞

宋玉忠

不详

机构：

[1] 西华大学电气信息学院

[2] 西华大学图书馆

[3] 西华大学图书馆四川成都

[4] 四川成都

来源：

关键词：

Web; 企业信息挖掘; HTML; XML; 数据抽取;

D O I：

暂无

中图分类号：

TP393.09 [];

学科分类号：

080402 ;

摘要：

从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。

引用

页码：1398 / 1402

页数：5