基于Cramer's V的连续属性离散化算法

被引:2
作者
郭启铭
樊玮
机构
[1] 中国民航大学软件技术研究中心 天津300300
[2] 中国民航大学软件技术研究中心
关键词
连续属性; 离散化; 分类;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
在类-属性相关离散化方法的基础上,提出一种基于Cramer’s V的连续属性离散化算法CVM,该方法利用统计学中的Cramer’s V来量化类-属性相关度,以保证离散后的类-属性相关度最大。与CADD和CAIM算法的实验比较以及对离散化后的数据进行C4.5分类测试,表明CVM算法性能良好,其离散化的数据明显地提高了分类器的预测精度。
引用
收藏
页码:111 / 112 +115
页数:3
相关论文
共 2 条
[1]   归纳式学习中连续型数据的区间划分问题 [J].
陈秉正 ;
韩春鹏 .
系统工程理论与实践, 2001, (04) :1-7
[2]  
实用统计方法[M]. 科学出版社 , 梅长林, 2002