基于Hadoop的小文件存储优化方案

被引:12
作者
李孟
曹晟
秦志光
机构
[1] 电子科技大学计算机科学与工程学院
关键词
Hadoop; 索引机制; 关联关系; 小文件存储;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Hadoop作为成熟的分布式云平台,对较大的文件提供了可靠高效的存储服务,但在处理海量小文件时效率显著降低。该文提出了基于Hadoop的海量教育资源小文件的存储优化方案,利用教育资源小文件间的关联关系,将小文件进行合并成大文件以减少文件数量,并索引机制访问小文件、元数据缓存和关联小文件预取机制来提高文件的读取效率。实验结果表明,该方法提高了Hadoop文件系统存储小文件的存取效率。
引用
收藏
页码:141 / 145
页数:5
相关论文
共 2 条
  • [1] FlatLFS:一种面向海量小文件处理优化的轻量级文件系统
    付松龄
    廖湘科
    黄辰林
    王蕾
    李姗姗
    [J]. 国防科技大学学报, 2013, 35 (02) : 120 - 126
  • [2] Implementing WebGIS on Hadoop:A case study of improving small file I/O performance on HDFS .2 Liu Xu-hui,Han Ji-zhong,Zhong Yun-qin,et al. Cluster Computing and Workshops (CLUSTER’’09) . 2009