一种新的用于连续值属性离散化的约简算法

被引:21
作者
刘震宇
郭宝龙
杨林耀
机构
[1] 西安电子科技大学测控工程系
[2] 西安电子科技大学测控工程系 陕西西安
[3] 陕西西安
关键词
数据挖掘; 粗糙集理论; 离散化; 约简算法;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
针对在 Nguyen和 Skowron的离散化算法中进行启发式约简时会出现某些属性不能进行离散化问题 ,以及在无核数据集中启发式约简算法计算量比较大等问题 ,在粗糙集理论和属性频率函数的基础上给出一个新概念——候选核 ,并提出一种新的用于连续值属性离散化的约简算法——基于候选核的启发式约简算法 (简称 BCC)。该算法可以寻找到能对所有属性进行离散化的约简。实验表明 ,所提出的 BCC算法能提高大数据集的离散化效果。
引用
收藏
页码:545 / 549
页数:5
相关论文
共 2 条
[1]
Discretization of real value attributes: A boolean reasoning approach Nguyen H S; 1997,
[2]
Knowledgediscovery in databases: An attribute-oriented rough set approach Hu X H; 1995,