基于属性相关分析的离群数据并行挖掘算法

被引:3
作者
王磊
张继福
机构
[1] 太原科技大学计算机科学与技术学院
关键词
数据挖掘; 并行计算; 局部离群数据; 属性相关分析; 冗余属性;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对高维海量数据集中的局部离群数据,利用并行计算和属性相关性分析思想,给出了一种离群数据并行挖掘算法。该算法首先由主节点分配属性相关分析任务,各个子节点并行查找数据集中的冗余属性,将其冗余属性传回主节点,并由主节点删除;其次,主节点分配搜索任务,各子节点采用微粒群算法,并行搜索局部离群子空间;再次,由主节点对局部离群子空间合并计算后,确定全局离群数据;最后,在MPICH2-1.0.3的并行计算环境下,采用恒星光谱数据作为数据集,实验结果验证了算法的正确性和有效性。
引用
收藏
页码:364 / 369
页数:6
相关论文
共 8 条
[1]
基于属性相关分析的局部离群数据挖掘算法研究及其应用 [D]. 
王磊 .
太原科技大学,
2011
[2]
An effective and efficient algorithm for high-dimensional outlier detection [J].
Aggarwal, CC ;
Yu, PS .
VLDB JOURNAL, 2005, 14 (02) :211-221
[3]
Mining Projected Clusters in High-Di mensional Spaces..Bouguessa M;Wang S;.IEEE Trans on Knowledge and Da-ta Engineering.2009, 04
[4]
一种基于网格的概念格分布式构造方法 [J].
王玮 ;
张继福 .
太原科技大学学报, 2010, 31 (03) :197-201
[5]
一种基于约束FP树的天体光谱数据相关性分析方法 [J].
张继福 ;
赵旭俊 .
模式识别与人工智能, 2009, 22 (04) :639-646
[6]
基于微粒群和子空间的离群数据挖掘算法研究 [J].
葛凌云 ;
张继福 ;
蔡江辉 .
系统仿真学报, 2009, 21 (07) :1897-1900+1903
[7]
基于概念格的天体光谱离群数据识别方法 [J].
张继福 ;
蒋义勇 ;
胡立华 ;
蔡江辉 ;
张素兰 .
自动化学报, 2008, (09) :1060-1066
[8]
基于聚类的离群数据挖掘及应用 [J].
蔡江辉 ;
张继福 .
太原重型机械学院学报, 2004, (04) :254-258