大数据下不完备信息系统近似空间的并行算法

被引:4
作者
姜麟
米允龙
王添
机构
[1] 昆明理工大学理学院
关键词
MapReduce; 数据挖掘; 海量数据; 粗糙集; 不完备信息系统; 近似空间;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP311.13 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ;
摘要
上、下近似空间是粗糙理论的重要概念,解决上、下近似问题是海量数据挖掘的基础。经典的近似空间算法不适合处理海量数据,更不适合处理带缺失信息的海量数据问题。为此,通过深度分析带缺失信息的海量数据特征,结合MapReduce编程模型,提出了基于MapReduce框架下近似空间的并行算法,以处理带缺失信息的海量数据,实验结果表明了该并行算法的有效性。
引用
收藏
页码:101 / 106
页数:6
相关论文
共 10 条
[1]   MapReduce框架下并行知识约简算法模型研究 [J].
钱进 ;
苗夺谦 ;
张泽华 ;
张志飞 .
计算机科学与探索, 2013, 7 (01) :35-45
[2]   基于MapReduce的分布式近邻传播聚类算法 [J].
鲁伟明 ;
杜晨阳 ;
魏宝刚 ;
沈春辉 ;
叶振超 .
计算机研究与发展, 2012, (08) :1762-1772
[3]   基于MapReduce的Web日志挖掘 [J].
李彬 ;
刘莉莉 .
计算机工程与应用 , 2012, (22) :95-98
[4]   云计算环境下知识约简算法 [J].
钱进 ;
苗夺谦 ;
张泽华 .
计算机学报, 2011, 34 (12) :2332-2343
[5]   云计算环境下差别矩阵知识约简算法研究 [J].
钱进 ;
苗夺谦 ;
张泽华 .
计算机科学, 2011, 38 (08) :193-196
[6]   集值信息系统的知识约简与属性特征 [J].
宋笑雪 ;
李鸿儒 ;
张文修 .
计算机工程, 2006, (22) :26-27+36
[7]   集值决策信息系统的知识约简与属性特征 [J].
宋笑雪 ;
李鸿儒 ;
张文修 .
计算机科学, 2006, (07) :179-181+235
[8]  
信息系统与知识发现[M]. 科学出版社 , 张文修等编著, 2003
[9]  
粗糙集理论与方法[M]. 科学出版社 , 张文修等编著, 2001
[10]  
The Google file system .2 Ghemawat S,Gobioff H,Leung ST. 19th ACM Symposium on Operating Systems Principles . 2003