基于Hadoop平台的并行特征匹配算法研究

被引:7
作者
李宝禄 [1 ]
张伟 [1 ,2 ]
机构
[1] 北京信息科技大学计算机学院
[2] 北京信息科技大学网络文化与数字传播北京市重点实验室
关键词
分布式文件系统; 大数据; 特征匹配; 并行扫描;
D O I
暂无
中图分类号
TP333 [存贮器];
学科分类号
140102 [集成电路设计与设计自动化];
摘要
很多大企业采用Hadoop分布式文件系统来存储海量数据,而传统的病毒扫描主要针对单机系统环境。研究如何并行化病毒扫描中的核心特征匹配算法来处理分布式海量数据。在Hadoop平台下,基于MapReduce并行编程模型来实现大数据高效的病毒扫描,特别是针对Hadoop处理海量小文件效率低的问题,通过将小文件合并,再利用索引来提高海量小文件的处理效率。实验结果表明,提出的并行特征匹配算法可以显著降低处理时间,适用于大数据的病毒扫描。
引用
收藏
页码:3320 / 3323
页数:4
相关论文
共 5 条
[1]
基于Hadoop的海量小文件处理方法的研究 [D]. 
泰冬雪 .
辽宁大学,
2011
[2]
一种Hadoop小文件存储和读取的方法 [J].
张春明 ;
芮建武 ;
何婷婷 .
计算机应用与软件, 2012, 29 (11) :95-100
[3]
基于Hadoop的海量数据存储平台设计与开发 [J].
崔杰 ;
李陶深 ;
兰红星 .
计算机研究与发展, 2012, 49(S1) (S1) :12-18
[4]
基于云计算平台Hadoop的并行k-means聚类算法设计研究 [J].
赵卫中 ;
马慧芳 ;
傅燕翔 ;
史忠植 .
计算机科学, 2011, 38 (10) :166-168+176
[5]
一种提高云存储中小文件存储效率的方案 [J].
余思 ;
桂小林 ;
黄汝维 ;
庄威 .
西安交通大学学报, 2011, 45 (06) :59-63