基于Hadoop的海量共现矩阵生成方法

被引：14

作者：

杨代庆 ^{[1
,2
]}

张智雄 ^{[1
]}

机构：

[1] 中国科学院国家科学图书馆

[2] 中国科学技术信息研究所

来源：

关键词：

Hadoop; MapReduce; 共现矩阵; 开源软件;

D O I：

暂无

中图分类号：

TP182 [专家系统、知识工程];

学科分类号：

1111 ;

摘要：

海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。

引用

页码：23 / 26

页数：4

共 8 条

[1] HadoopMapReduce. http://wiki.a-pache.org/hadoop/HadoopMapReduce . 2008
[2] Hadoop Cluster Setup. http://ha-doop.apache.org/core/docs/current/cluster_setup.html . 2008
[3] HDFS Architecture. http://hadoop.apache.org/core/docs/current/hdfs_design.html . 2008
[4] CloudBase. http://sourceforge.net/projects/cloudbase/ . 2009
[5] Pig. http://hadoop.apache.org/pig/ . 2009
[6] Hive. http://hadoop.apache.org/hive/ . 2009
[7] Hbase. http://hadoop.apache.org/hbase/ . 2009
[8] Distributed Computing with Linux and Hadoop.. http://www.ibm.com/developerworks/linux/library/l-hadoop/index.html . 2009