案例推理中属性约简及其性能评价

被引:12
作者
李锋刚
倪志伟
杨善林
黄玲
机构
[1] 合肥工业大学管理学院 合肥230009
[2] 合肥工业大学管理学院
基金
安徽省自然科学基金;
关键词
案例推理; 属性约简; 熵; k-fold交叉验证; k-近邻(k-NN)方法;
D O I
10.16511/j.cnki.qhdxxb.2006.s1.021
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在案例推理技术中,属性集合表征了对系统有影响的各种因子的集合,属性的选择和约简成为决定系统性能的关键因素。该文在分析属性约简技术的基础上,研究了基于熵的两种属性选择策略,即信息增益法和增益比率法,用层次化k-fo ld交叉验证和k-近邻(k-NN)相结合的技术,设计了5种方案,分别从不同角度来考察两种属性选择策略对案例分类性能的影响。实验结果表明,基于熵的属性选择策略能找到一个充分分离案例类别的属性子集,改善属性的表示空间。
引用
收藏
页码:1025 / 1029
页数:5
相关论文
empty
未找到相关数据