大数据机器学习系统研究进展

被引:50
作者
黄宜华 [1 ,2 ]
机构
[1] 南京大学计算机软件新技术国家重点实验室
[2] 南京大学PASA大数据技术实验室
关键词
大数据; 机器学习; 分布并行计算; 大数据处理平台;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
要实现高效的大数据机器学习,需要构建一个能同时支持机器学习算法设计和大规模数据处理的一体化大数据机器学习系统。研究设计高效、可扩展且易于使用的大数据机器学习系统面临诸多技术挑战。近年来,大数据浪潮的兴起,推动了大数据机器学习的迅猛发展,使大数据机器学习系统成为大数据领域的一个热点研究问题。介绍了国内外大数据机器学习系统的基本概念、基本研究问题、技术特征、系统分类以及典型系统;在此基础上,进一步介绍了本实验室研究设计的一个跨平台统一大数据机器学习系统——Octopus(大章鱼)。
引用
收藏
页码:35 / 54
页数:20
相关论文
共 1 条
[1]   The Stratosphere platform for big data analytics [J].
Alexandrov, Alexander ;
Bergmann, Rico ;
Ewen, Stephan ;
Freytag, Johann-Christoph ;
Hueske, Fabian ;
Heise, Arvid ;
Kao, Odej ;
Leich, Marcus ;
Leser, Ulf ;
Markl, Volker ;
Naumann, Felix ;
Peters, Mathias ;
Rheinlaender, Astrid ;
Sax, Matthias J. ;
Schelter, Sebastian ;
Hoeger, Mareike ;
Tzoumas, Kostas ;
Warneke, Daniel .
VLDB JOURNAL, 2014, 23 (06) :939-964