基于数据挖掘的大数据管理模型研究

被引:24
作者
吴晓英 [1 ]
明均仁 [2 ]
机构
[1] 重庆科技学院图书馆
[2] 武汉工程大学管理学院
关键词
大数据; 管理模型; 数据挖掘; TRS海贝大数据管理系统;
D O I
10.13833/j.cnki.is.2015.11.024
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
在大数据时代,数据量正在以极快的速度增长,有效管理这些庞大的复杂数据资源将成为大数据时代的主旋律。本文以数据挖掘技术为核心,构建了基于数据挖掘的大数据管理模型。该模型以Hadoop开源平台为支撑,利用RDBMS存储结构化数据、HDFS存储非结构化与半结构化数据,基于混淆网络的关键词前向检索识别算法进行海量数据的特征检索与匹配,并在Hive平台下调用Mahout算法进行数据挖掘与分析,同时结合Map Reduce技术进行并行实时分析。通过实例分析得出,该模型能够有效地提高海量数据分析的动态性、执行效率与智能水平,实现动态、一体化的数据采集、存储、分析及应用任务。
引用
收藏
页码:131 / 134
页数:4
相关论文
共 6 条
[1]   基于普适云的大数据挖掘 [J].
时念云 ;
王文佳 ;
马力 .
计算机系统应用, 2013, 22 (11) :7-12
[2]   大数据时代下的情报分析与挖掘技术研究——电信客户流失情况分析 [J].
王晓佳 ;
杨善林 ;
陈志强 .
情报学报, 2013, 32 (06) :564-574
[3]   大数据知识服务的内涵、典型特征及概念模型 [J].
秦晓珠 ;
李晨晖 ;
麦范金 .
情报资料工作 , 2013, (02) :18-22
[4]   大数据分析——RDBMS与MapReduce的竞争与共生 [J].
覃雄派 ;
王会举 ;
杜小勇 ;
王珊 .
软件学报, 2012, 23 (01) :32-45
[5]   结合关键词混淆网络的关键词检出系统 [J].
张磊 ;
陈晶 ;
项学智 ;
贾梅梅 .
智能系统学报, 2010, 5 (05) :432-435
[6]  
基于P2P可伸缩架构的大数据分析平台研究与实现.[D].卓安.清华大学.2012, 07