一种基于基尼指标的高维数据离群挖掘算法

被引:4
作者
石岩
刘爱琴
张继福
机构
[1] 太原科技大学计算机科学与技术学院
关键词
离群数据; 高维数据; 属性相关性分析; 基尼指标;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
针对高维数据集中的离群点挖掘任务,给出了一种基于基尼指标和属性相关性分析的高维数据离群点挖掘算法。该算法首先采用属性相关性分析方法,删除高维数据集中的冗余属性,缩减了数据集的大小;其次采用基尼指标作为离群度量因子,从缩减后的数据集中,挖掘出不同离群程度的数据点;最后,实验采用天体光谱数据作为实验数据集,经实验验证,该算法对高维数据集中离群点的挖掘算法是有效的和可行的,其效率得到了明显的提高。
引用
收藏
页码:161 / 165
页数:5
相关论文
共 9 条
[1]
基于基尼指标和子空间的离群数据挖掘方法研究 [D]. 
孙伟伟 .
太原科技大学,
2012
[2]
基于距离的不确定离群点检测 [J].
于浩 ;
王斌 ;
肖刚 ;
杨晓春 .
计算机研究与发展, 2010, 47 (03) :474-484
[3]
高维数据特征降维研究综述 [J].
胡洁 .
计算机应用研究, 2008, (09) :2601-2606
[4]
基于局部信息熵的加权子空间离群点检测算法 [J].
倪巍伟 ;
陈耿 ;
陆介平 ;
吴英杰 ;
孙志挥 .
计算机研究与发展, 2008, (07) :1189-1194
[5]
基于信息熵的相对离群点的检测方法:ENBROD [J].
于绍越 ;
商琳 .
南京大学学报(自然科学版), 2008, (02) :212-218
[6]
决策树中基于基尼指数的属性分裂方法 [J].
陈云樱 ;
吴积钦 ;
徐可佳 .
微机发展, 2004, (05) :66-68
[7]
A concept lattice based outlier mining method in low-dimensional subspaces [J].
Zhang, Jifu ;
Jiang, Yiyong ;
Chang, Kai H. ;
Zhang, Sulan ;
Cai, Jianghui ;
Hu, Lihua .
PATTERN RECOGNITION LETTERS, 2009, 30 (15) :1434-1439
[8]
An effective and efficient algorithm for high-dimensional outlier detection [J].
Aggarwal, CC ;
Yu, PS .
VLDB JOURNAL, 2005, 14 (02) :211-221
[9]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,