学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
改进型加权KNN算法的不平衡数据集分类
被引:27
作者
:
论文数:
引用数:
h-index:
机构:
王超学
[
1
]
论文数:
引用数:
h-index:
机构:
潘正茂
[
1
]
论文数:
引用数:
h-index:
机构:
马春森
[
2
]
论文数:
引用数:
h-index:
机构:
董丽丽
[
1
]
论文数:
引用数:
h-index:
机构:
张涛
[
1
]
机构
:
[1]
西安建筑科技大学信息与控制工程学院
[2]
中国农业科学院植物保护研究所
来源
:
计算机工程
|
2012年
/ 38卷
/ 20期
关键词
:
不平衡数据集;
分类;
K最邻近算法;
权重分配模型;
遗传算法;
K-means算法;
D O I
:
暂无
中图分类号
:
TP181 [自动推理、机器学习];
学科分类号
:
081104 ;
0812 ;
0835 ;
1405 ;
摘要
:
K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。
引用
收藏
页码:160 / 163+168 +168
页数:5
相关论文
共 6 条
[1]
不平衡入侵检测数据的代价敏感分类策略
[J].
边婧
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学计算机与软件学院
山西职工医学院计算机系
太原理工大学计算机与软件学院
边婧
;
彭新光
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学计算机与软件学院
太原理工大学计算机与软件学院
彭新光
.
计算机应用研究,
2009,
26
(08)
:3036
-3038+3043
[2]
kNN文本分类器类偏斜问题的一种处理对策
[J].
郝秀兰
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
郝秀兰
;
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
陶晓鹏
;
徐和祥
论文数:
0
引用数:
0
h-index:
0
机构:
上海远程教育集团
复旦大学计算机与信息技术系
徐和祥
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
胡运发
.
计算机研究与发展,
2009,
46
(01)
:52
-61
[3]
基于密度的kNN文本分类器训练样本裁剪方法
[J].
论文数:
引用数:
h-index:
机构:
李荣陆
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系,复旦大学计算机与信息技术系上海,上海
胡运发
.
计算机研究与发展,
2004,
(04)
:539
-545
[4]
基于群体智能的聚类分析[D]. 曲建华.山东师范大学 2010
[5]
A multi-objective optimisation approach for class imbalance learning
[J].
Soda, Paolo
论文数:
0
引用数:
0
h-index:
0
机构:
Integrated Res Ctr, Med Informat & Comp Sci Lab, I-00128 Rome, Italy
Integrated Res Ctr, Med Informat & Comp Sci Lab, I-00128 Rome, Italy
Soda, Paolo
.
PATTERN RECOGNITION,
2011,
44
(08)
:1801
-1810
[6]
Neighbor-weighted K-nearest neighbor for unbalanced text corpus
[J].
Tan, SB
论文数:
0
引用数:
0
h-index:
0
机构:
Chinese Acad Sci, Inst Comp Technol, Software Dept, Beijing 100080, Peoples R China
Tan, SB
.
EXPERT SYSTEMS WITH APPLICATIONS,
2005,
28
(04)
:667
-671
←
1
→
共 6 条
[1]
不平衡入侵检测数据的代价敏感分类策略
[J].
边婧
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学计算机与软件学院
山西职工医学院计算机系
太原理工大学计算机与软件学院
边婧
;
彭新光
论文数:
0
引用数:
0
h-index:
0
机构:
太原理工大学计算机与软件学院
太原理工大学计算机与软件学院
彭新光
.
计算机应用研究,
2009,
26
(08)
:3036
-3038+3043
[2]
kNN文本分类器类偏斜问题的一种处理对策
[J].
郝秀兰
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
郝秀兰
;
陶晓鹏
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
陶晓鹏
;
徐和祥
论文数:
0
引用数:
0
h-index:
0
机构:
上海远程教育集团
复旦大学计算机与信息技术系
徐和祥
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
复旦大学计算机与信息技术系
胡运发
.
计算机研究与发展,
2009,
46
(01)
:52
-61
[3]
基于密度的kNN文本分类器训练样本裁剪方法
[J].
论文数:
引用数:
h-index:
机构:
李荣陆
;
胡运发
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系,复旦大学计算机与信息技术系上海,上海
胡运发
.
计算机研究与发展,
2004,
(04)
:539
-545
[4]
基于群体智能的聚类分析[D]. 曲建华.山东师范大学 2010
[5]
A multi-objective optimisation approach for class imbalance learning
[J].
Soda, Paolo
论文数:
0
引用数:
0
h-index:
0
机构:
Integrated Res Ctr, Med Informat & Comp Sci Lab, I-00128 Rome, Italy
Integrated Res Ctr, Med Informat & Comp Sci Lab, I-00128 Rome, Italy
Soda, Paolo
.
PATTERN RECOGNITION,
2011,
44
(08)
:1801
-1810
[6]
Neighbor-weighted K-nearest neighbor for unbalanced text corpus
[J].
Tan, SB
论文数:
0
引用数:
0
h-index:
0
机构:
Chinese Acad Sci, Inst Comp Technol, Software Dept, Beijing 100080, Peoples R China
Tan, SB
.
EXPERT SYSTEMS WITH APPLICATIONS,
2005,
28
(04)
:667
-671
←
1
→