一个面向大规模数据库的数据挖掘系统

被引:23
作者
钱卫宁
魏藜
王焱
钱海蕾
周傲英
机构
[1] 复旦大学计算机科学与工程系
[2] 复旦大学智能信息处理开放实验室
关键词
数据挖掘; 系统; 数据预处理; 存储控制; 挖掘库;
D O I
10.13328/j.cnki.jos.2002.08.028
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据挖掘融合了数据库技术、人工智能和统计学,是目前的研究热点.为了能够集成当前数据挖掘的主要技术并使它们协同工作,在进行数据挖掘基本算法研究的基础上研制开发了一个数据挖掘系统——Golden-Eye.系统实现了在数据挖掘研究中的一些最新成果,集成了泛化、数据清洗这两个数据准备操作以及关联规则发现、例外规则发现、时序模式发现、分类器构造、聚类分析等基本数据挖掘操作,并实现了对挖掘操作的基本管理和结果的图形化显示.整个框架设计充分体现了系统的完整性、协调性和高效性:自底向上将存储控制模块、数据预处理模块、挖掘操作模块、挖掘库管理模块有机地结合在一起,在底层实现了对包括中间结果在内的数据的统一管理,在上层为用户提供了可视化的界面.实验结果表明,该系统能够在大规模数据库上成功地完成用户所指定的数据挖掘操作.
引用
收藏
页码:1540 / 1545
页数:6
相关论文
共 2 条
  • [1] An n-gram-based approach for detecting approximately duplicate database records
    Tian Z.
    Lu H.
    Ji W.
    Zhou A.
    Tian Z.
    [J]. International Journal on Digital Libraries, 2002, 3 (4) : 325 - 331
  • [2] Approaches for scaling DBSCAN algorithm to large spatial databases[J] . Aoying Zhou,Shuigeng Zhou,Jing Cao,Ye Fan,Yunfa Hu.Journal of Computer Science and Technology . 2000 (6)