基于粗集理论的数据离散化新算法

被引:27
作者
赵军
王国胤
吴中福
李华
机构
[1] 重庆大学计算机学院
[2] 重庆邮电学院计算机科学与技术研究所
关键词
粗集; 分辨关系; 离散化; 断点;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
摘要
连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一 ,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路 ,研究了候选断点重要性的衡量方式 ,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点 ,选择的断点都能够保证信息系统的分辨关系 ,并能够取得较理想的离散化结果。
引用
收藏
页码:18 / 21
页数:4
相关论文
共 3 条
[1]   连续属性空间上的规则学习算法 [J].
权光日 ;
刘文远 ;
叶风 ;
陈晓鹏 .
软件学报, 1999, (11) :0-0+0
[2]  
Rough集理论与知识获取[M]. 西安交通大学出版社 , 王国胤编著, 2001
[3]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356