学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于基尼指标的高维数据离群挖掘算法
被引:4
作者
:
论文数:
引用数:
h-index:
机构:
石岩
论文数:
引用数:
h-index:
机构:
刘爱琴
论文数:
引用数:
h-index:
机构:
张继福
机构
:
[1]
太原科技大学计算机科学与技术学院
来源
:
太原科技大学学报
|
2013年
/ 34卷
/ 03期
关键词
:
离群数据;
高维数据;
属性相关性分析;
基尼指标;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
摘要
:
针对高维数据集中的离群点挖掘任务,给出了一种基于基尼指标和属性相关性分析的高维数据离群点挖掘算法。该算法首先采用属性相关性分析方法,删除高维数据集中的冗余属性,缩减了数据集的大小;其次采用基尼指标作为离群度量因子,从缩减后的数据集中,挖掘出不同离群程度的数据点;最后,实验采用天体光谱数据作为实验数据集,经实验验证,该算法对高维数据集中离群点的挖掘算法是有效的和可行的,其效率得到了明显的提高。
引用
收藏
页码:161 / 165
页数:5
相关论文
共 9 条
[1]
基于基尼指标和子空间的离群数据挖掘方法研究
[D].
论文数:
引用数:
h-index:
机构:
孙伟伟
.
太原科技大学,
2012
[2]
基于距离的不确定离群点检测
[J].
论文数:
引用数:
h-index:
机构:
于浩
;
论文数:
引用数:
h-index:
机构:
王斌
;
论文数:
引用数:
h-index:
机构:
肖刚
;
论文数:
引用数:
h-index:
机构:
杨晓春
.
计算机研究与发展,
2010,
47
(03)
:474
-484
[3]
高维数据特征降维研究综述
[J].
论文数:
引用数:
h-index:
机构:
胡洁
.
计算机应用研究,
2008,
(09)
:2601
-2606
[4]
基于局部信息熵的加权子空间离群点检测算法
[J].
论文数:
引用数:
h-index:
机构:
倪巍伟
;
论文数:
引用数:
h-index:
机构:
陈耿
;
陆介平
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省镇江市科技局
东南大学计算机科学与工程学院
陆介平
;
论文数:
引用数:
h-index:
机构:
吴英杰
;
论文数:
引用数:
h-index:
机构:
孙志挥
.
计算机研究与发展,
2008,
(07)
:1189
-1194
[5]
基于信息熵的相对离群点的检测方法:ENBROD
[J].
于绍越
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室南京大学计算机科学与技术系
于绍越
;
论文数:
引用数:
h-index:
机构:
商琳
.
南京大学学报(自然科学版),
2008,
(02)
:212
-218
[6]
决策树中基于基尼指数的属性分裂方法
[J].
陈云樱
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学电气工程学院,西南交通大学电气工程学院,西南交通大学电气工程学院四川成都,四川成都,四川成都
陈云樱
;
论文数:
引用数:
h-index:
机构:
吴积钦
;
论文数:
引用数:
h-index:
机构:
徐可佳
.
微机发展,
2004,
(05)
:66
-68
[7]
A concept lattice based outlier mining method in low-dimensional subspaces
[J].
Zhang, Jifu
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Zhang, Jifu
;
Jiang, Yiyong
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Jiang, Yiyong
;
Chang, Kai H.
论文数:
0
引用数:
0
h-index:
0
机构:
Auburn Univ, Dept Comp Sci & Software Engn, Auburn, AL 36849 USA
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Chang, Kai H.
;
Zhang, Sulan
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Zhang, Sulan
;
论文数:
引用数:
h-index:
机构:
Cai, Jianghui
;
Hu, Lihua
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Hu, Lihua
.
PATTERN RECOGNITION LETTERS,
2009,
30
(15)
:1434
-1439
[8]
An effective and efficient algorithm for high-dimensional outlier detection
[J].
Aggarwal, CC
论文数:
0
引用数:
0
h-index:
0
机构:
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
Aggarwal, CC
;
Yu, PS
论文数:
0
引用数:
0
h-index:
0
机构:
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
Yu, PS
.
VLDB JOURNAL,
2005,
14
(02)
:211
-221
[9]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
←
1
→
共 9 条
[1]
基于基尼指标和子空间的离群数据挖掘方法研究
[D].
论文数:
引用数:
h-index:
机构:
孙伟伟
.
太原科技大学,
2012
[2]
基于距离的不确定离群点检测
[J].
论文数:
引用数:
h-index:
机构:
于浩
;
论文数:
引用数:
h-index:
机构:
王斌
;
论文数:
引用数:
h-index:
机构:
肖刚
;
论文数:
引用数:
h-index:
机构:
杨晓春
.
计算机研究与发展,
2010,
47
(03)
:474
-484
[3]
高维数据特征降维研究综述
[J].
论文数:
引用数:
h-index:
机构:
胡洁
.
计算机应用研究,
2008,
(09)
:2601
-2606
[4]
基于局部信息熵的加权子空间离群点检测算法
[J].
论文数:
引用数:
h-index:
机构:
倪巍伟
;
论文数:
引用数:
h-index:
机构:
陈耿
;
陆介平
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省镇江市科技局
东南大学计算机科学与工程学院
陆介平
;
论文数:
引用数:
h-index:
机构:
吴英杰
;
论文数:
引用数:
h-index:
机构:
孙志挥
.
计算机研究与发展,
2008,
(07)
:1189
-1194
[5]
基于信息熵的相对离群点的检测方法:ENBROD
[J].
于绍越
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室南京大学计算机科学与技术系
于绍越
;
论文数:
引用数:
h-index:
机构:
商琳
.
南京大学学报(自然科学版),
2008,
(02)
:212
-218
[6]
决策树中基于基尼指数的属性分裂方法
[J].
陈云樱
论文数:
0
引用数:
0
h-index:
0
机构:
西南交通大学电气工程学院,西南交通大学电气工程学院,西南交通大学电气工程学院四川成都,四川成都,四川成都
陈云樱
;
论文数:
引用数:
h-index:
机构:
吴积钦
;
论文数:
引用数:
h-index:
机构:
徐可佳
.
微机发展,
2004,
(05)
:66
-68
[7]
A concept lattice based outlier mining method in low-dimensional subspaces
[J].
Zhang, Jifu
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Zhang, Jifu
;
Jiang, Yiyong
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Jiang, Yiyong
;
Chang, Kai H.
论文数:
0
引用数:
0
h-index:
0
机构:
Auburn Univ, Dept Comp Sci & Software Engn, Auburn, AL 36849 USA
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Chang, Kai H.
;
Zhang, Sulan
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Zhang, Sulan
;
论文数:
引用数:
h-index:
机构:
Cai, Jianghui
;
Hu, Lihua
论文数:
0
引用数:
0
h-index:
0
机构:
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Taiyuan Univ Sci & Technol, Sch Comp Sci & Technol, Taiyuan 030024, Peoples R China
Hu, Lihua
.
PATTERN RECOGNITION LETTERS,
2009,
30
(15)
:1434
-1439
[8]
An effective and efficient algorithm for high-dimensional outlier detection
[J].
Aggarwal, CC
论文数:
0
引用数:
0
h-index:
0
机构:
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
Aggarwal, CC
;
Yu, PS
论文数:
0
引用数:
0
h-index:
0
机构:
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
IBM TJ Watson Res Ctr, Hawthorne, NY 10532 USA
Yu, PS
.
VLDB JOURNAL,
2005,
14
(02)
:211
-221
[9]
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
←
1
→