共 2 条
一种基于熵的连续属性离散化算法
被引:15
作者:
贺跃
郑建军
朱蕾
机构:
[1] 北京理工大学信息科学技术学院
[2] 北京理工大学管理与经济学院
来源:
关键词:
熵;
连续属性;
离散化;
分类;
D O I:
暂无
中图分类号:
TP301.6 [算法理论];
学科分类号:
摘要:
连续属性离散化的关键在于合理确定离散化划分点的个数和位置。为了提高无监督离散化的效率,给出一种基于熵的连续属性离散化方法。该方法利用连续属性的信息量 (熵 )的特性,通过对连续属性变量的自身划分,最小化信息熵的减少和区间数,并寻求熵的损失与适度的区间数之间的最佳平衡,以便得到优化的离散值。实验表明该算法是行之有效的。
引用
收藏
页码:637 / 638+651
+651
页数:3
相关论文