一种基于信息增益的K-NN改进算法

被引:5
作者
豆增发 [1 ]
王英强 [2 ]
王保保 [1 ]
机构
[1] 西安电子科技大学计算机学院
[2] 西安思源学院计算机科学与技术系
关键词
K-最近邻算法; 信息增益; 信息熵;
D O I
10.16180/j.cnki.issn1007-7820.2006.12.015
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
K-最近邻(K-nearestneighbor,简称KNN)算法是一种在人工智能领域如专家系统、数据挖掘、模式识别等方面广泛应用的算法。该算法简单有效,易于实现,但是其K值难以确定,而且分类结果易受单个属性干扰。文中提出了一种简单易行的K值确定方法,并利用Quinlan信息增益理论,提出了基于信息增益的K-最近邻改进算法。通过实验证明,改进后的K-NN算法具有较强的抗干扰能力和较好的精确性。
引用
收藏
页码:52 / 56
页数:5
相关论文
共 1 条
[1]  
数据挖掘原理与技术.[M].张云涛;龚玲著;.电子工业出版社.2004,