近邻法参考样本集的最优选择

被引:6
作者
张鸿宾
孙广煜
机构
[1] 北京工业大学计算机学院!北京
关键词
近邻分类; Tabu搜索; 参考样本集;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
为克服近邻分类法需要大量计算和存储的缺点 ,本文利用Tabu搜索来求解满足一定错误率条件的最小参考样本集 .当错误率阈值设为 0时 ,可以得到原训练集的一致子集 .当错误率阈值设为适当的非零值时 ,可以较好地克服近邻估计的偏置 .通过在Tabu搜索中引入适当的激活 (aspiration)条件 ,避免了在可行和不可行解区间无意义的来回搜索 ,加快了收敛的速度 .实验结果表明 ,本文算法在压缩比和分类性能上都优于经典的算法 .本文还证明了Dasarathy的算法[6] 得到的最小一致子集 (MinimalConsistentSet:MCS)不是最小的 ,其MCS也不一定是单调减的
引用
收藏
页码:16 / 21
页数:6
相关论文
共 1 条
  • [1] A bootstrap technique for nearest neighbor classifier design .2 Y. Hamamoto,S. Uchimura,and S. Tomita. IEEE Trans. on Pattern Analysis and Machine Intelligence, Jan . 1997