一个基于XML的WEB数据收集模型的研究

被引：19

作者：

陈玉芳

葛燧和

机构：

[1] 同济大学计算机科学与工程系

[2] 同济大学计算机科学与工程系上海

[3] 上海

来源：

计算机工程与应用 | 2004年 / 10期

关键词：

XML; WEB数据收集; RDF;

D O I：

暂无

中图分类号：

TP393.09 [];

学科分类号：

080402 ;

摘要：

目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果犤1犦。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。

引用

页码：150 / 152+156 +156

页数：4

共 5 条

[1]

XML编程起步.[M].(美)DaveMercer著;袁鹏飞译;.人民邮电出版社.2001,

[2] Web挖掘研究综述 [J].