一个基于XML的WEB数据收集模型的研究

被引:19
作者
陈玉芳
葛燧和
机构
[1] 同济大学计算机科学与工程系
[2] 同济大学计算机科学与工程系 上海
[3] 上海
关键词
XML; WEB数据收集; RDF;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果犤1犦。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。
引用
收藏
页码:150 / 152+156 +156
页数:4
相关论文
共 5 条
[1]  
XML编程起步.[M].(美)DaveMercer著;袁鹏飞译;.人民邮电出版社.2001,
[2]   Web挖掘研究综述 [J].
宋爱波 ;
董逸生 ;
吴文明 ;
孙志挥 .
计算机科学, 2001, (11) :13-16
[3]   Web数据库技术简述 [J].
张志强 ;
周立柱 ;
冯建华 .
计算机科学, 2001, (10) :1-6
[4]   XML应用研究 [J].
赵书良 .
计算机科学, 2001, (08) :94-95+88
[5]   基于Internet的信息资源发现技术与实现 [J].
王继成 ;
邹涛 ;
杨小江 ;
潘金贵 ;
张福炎 .
计算机研究与发展 , 1999, (11) :1369-1374