一种基于信息增益的K-NN改进算法

被引:10
作者
魏孝章 [1 ]
豆增发 [2 ]
机构
[1] 陕西教育学院数理工程系
[2] 西安电子科技大学计算机学院
关键词
K-NN算法; 信息增益; 信息熵; 可拓关联度;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对传统K-NN算法易受单个属性干扰和时间效率较低的问题,提出了利用信息增益和可拓关联度对其进行改进。通过计算属性的信息增益来确定属性的权重系数,根据权重系数将属性划分为关键属性、次要属性和无关属性,在计算欧氏距离时引入权重系数,使各个属性的作用受其重要性的约束,有效地提高了K-NN算法的抗干扰能力和精确性。将属性空间划分为若干个子空间,利用可拓关联度将待测样本映射到某个子空间中,由这个子空间组成搜索空间,减少计算量,提高时间效率;测试结果表明,改进后的算法可行有效。
引用
收藏
页码:188 / 191
页数:4
相关论文
共 3 条
[1]  
Machine Learning. Miitchell T M. . 1997
[2]  
PATTERN RECOGNITION[P]. RINGLAND SIMON PATRICK ALEXAND;TALINTYRE JOHN EDWARD.EP0917708B1,2002-03-27
[3]  
Fast k-Nearest Neighbor classification us-ing cluster-based trees. Zhang Bin,Srihari S N. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2004