面向服务的云数据挖掘引擎的研究

被引:20
作者
余永红 [1 ,2 ]
向晓军 [1 ]
高阳 [1 ]
商琳 [1 ]
杨育彬 [1 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京邮电大学通达学院
关键词
云计算; Hadoop; 数据挖掘; 面向服务的体系结构(SOA);
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
数据挖掘算法处理海量数据时,扩展性受到制约。在商业和科学研究的各个领域,知识发现的过程和需求差异较大,需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架,CloudDM利用开源云计算平台Hadoop处理海量数据的能力,以面向服务的形式支持分布式数据挖掘应用的设计和运行,并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎,可以有效解决海量数据挖掘中的海量数据存储、数据处理和数据挖掘算法互操作性等问题。
引用
收藏
页码:46 / 57
页数:12
相关论文
共 2 条
[1]   Cloud computing [J].
Hayes, Brian .
COMMUNICATIONS OF THE ACM, 2008, 51 (07) :9-11
[2]  
Globus Toolkit Version 4: Software for Service-Oriented Systems[J] . Ian Foster.Journal of Computer Science and Technology . 2006 (4)