基于Hadoop的海量共现矩阵生成方法

被引:14
作者
杨代庆 [1 ,2 ]
张智雄 [1 ]
机构
[1] 中国科学院国家科学图书馆
[2] 中国科学技术信息研究所
关键词
Hadoop; MapReduce; 共现矩阵; 开源软件;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
海量数据的处理分析是当前信息处理技术的热点之一,介绍开源并行系统Hadoop的体系结构以及基于Hadoop的MapReduce编程框架,并在Hadoop基础上提出一种通过多重MapReduce操作,实现海量共现矩阵的生成方法。
引用
收藏
页码:23 / 26
页数:4
相关论文
共 8 条
  • [1] HadoopMapReduce. http://wiki.a-pache.org/hadoop/HadoopMapReduce . 2008
  • [2] Hadoop Cluster Setup. http://ha-doop.apache.org/core/docs/current/cluster_setup.html . 2008
  • [3] HDFS Architecture. http://hadoop.apache.org/core/docs/current/hdfs_design.html . 2008
  • [4] CloudBase. http://sourceforge.net/projects/cloudbase/ . 2009
  • [5] Pig. http://hadoop.apache.org/pig/ . 2009
  • [6] Hive. http://hadoop.apache.org/hive/ . 2009
  • [7] Hbase. http://hadoop.apache.org/hbase/ . 2009
  • [8] Distributed Computing with Linux and Hadoop.. http://www.ibm.com/developerworks/linux/library/l-hadoop/index.html . 2009