学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于云计算的Web数据挖掘
被引:49
作者
:
论文数:
引用数:
h-index:
机构:
程苗
机构
:
[1]
中国科学技术大学管理学院
来源
:
计算机科学
|
2011年
/ 38(S1)卷
/ S1期
关键词
:
云计算;
数据挖掘;
Map/Reduce;
关联规则;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
因特网是一个巨大的、分布广泛的信息服务中心,其上产生的海量数据通常是地理上分布、异构、动态的,复杂性也越来越高,若用已有的集中式数据挖掘方法则不能满足应用的要求。为了解决这些问题,提出了一种基于云计算的Web数据挖掘方法:将海量数据和挖掘任务分解到多台服务器上并行处理。采用Hadoop开源平台,建立一个基于Apriori算法的并行关联规则挖掘算法来验证了该系统的高效性。还提出"计算向存储迁移"的设计思想,将计算在数据存储节点就地执行,从而避免了大量数据在网络上的传递,不会占用大量带宽。
引用
收藏
页码:146 / 149
页数:4
相关论文
未找到相关数据
未找到相关数据