一种基于HADOOP的办公文件存储方法

被引:2
作者
杜继华 [1 ]
吴伟明 [2 ]
谷勇浩 [2 ]
机构
[1] 北京邮电大学计算机科学与技术学院
[2] 北京邮电大学ANM研究室
关键词
计算机应用技术; HADOOP; 办公文件; 小文件; 顺序文件;
D O I
暂无
中图分类号
TP333 [存贮器];
学科分类号
140102 [集成电路设计与设计自动化];
摘要
HADOOP分布式文件系统为解决分布式存储提供了良好的平台。为了良好的管理办公系统中的日常办公文件,针对办公文件占用空间小而数量多而导致的体积庞大的特点,系统应用HADOOP分布式文件系统,为了减少命名节点的内存过大,提出了使用二进制序列化合并小文件的方案,并设置合并器,采取闲时合并,忙时存在本地降低写操作时间。并根据文件的属性分类归并写入,可以在查询时避免不必要的遍历而降低速度,提高检索性能。通过测试文件合并时间、文件上传时间以及文件查找读取时间,本方法可以很好的处理办公文件的上传与读取,解决办公文件的存储问题。
引用
收藏
页码:6 / 8
页数:3
相关论文
共 1 条
[1]
Hadoop权威指南.[M].(美) 怀特 (White;T.) ; 著.清华大学出版社.2011,