粗糙集中一种连续属性预处理方法

被引:4
作者
鄂旭
高学东
谢霖铨
贺海钧
机构
[1] 北京科技大学管理学院
[2] 北京科技大学管理学院 北京
[3] 辽宁工学院计算机系
[4] 辽宁锦州
[5] 北京
关键词
数据挖掘; 粗糙集; 预处理; 划分区间; 离散化;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C++编写的算法进行数值示例及测试数据库,实验结果表明此算法有效可行。
引用
收藏
页码:400 / 403
页数:4
相关论文
共 3 条
[1]   基于粗集理论的数据离散化方法 [J].
赵军 ;
王国胤 ;
吴中福 ;
唐宏 ;
李华 .
小型微型计算机系统, 2004, (01) :60-64
[2]   Rough Set理论中连续属性的离散化方法 [J].
苗夺谦 .
自动化学报, 2001, (03) :296-302
[3]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356