多策略数据挖掘系统的分析与设计

被引:1
作者
刘光远 [1 ]
董立岩 [2 ]
苑森淼 [2 ]
李永丽 [3 ]
孙涛 [2 ]
关伟洲 [3 ]
机构
[1] 吉林大学通信工程学院
[2] 吉林大学计算机科学与技术学院
[3] 东北师范大学计算机学院
关键词
数据挖掘; 海量数据处理; 算法插件;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
为了满足数据规模的膨胀和分析需求的增长,在对数据挖掘系统的发展史进行回顾的基础上,分析了国内外典型数据挖掘系统的特点,设计了一个多策略的数据挖掘系统。并针对数据挖掘面临的大规模海量数据的处理问题,为系统引入和设计了算法插件思想、缓冲区处理技术、基于XML(Extensib le M arkup Lan-guage)语言的配置文件和相应的并行处理技术。最后讨论了系统今后开发过程中需要注意算法更新及评估的问题。
引用
收藏
页码:610 / 617
页数:8
相关论文
共 5 条
[1]   并行数据挖掘研究 [J].
张潇 ;
恽爽 ;
陆桑璐 ;
陈道蓄 .
计算机工程, 2003, (17) :58-59+75
[2]   分布式并行数据挖掘系统的研究与实现 [J].
张学明 ;
施法中 .
计算机工程与应用, 2002, (04) :198-200
[3]   多策略通用数据采掘工具MSMiner [J].
游湘涛 ;
叶施仁 ;
史忠植 .
计算机研究与发展, 2001, (05) :581-586
[4]  
SAS系统SAS/STAT软件使用手册[M]. 中国统计出版社 , 高惠璇等编译, 1997
[5]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)