基于粗糙集的区间型数据离散化算法

被引:14
作者
谭旭
唐云岚
陈英武
机构
[1] 国防科学技术大学信息系统与管理学院
关键词
粗糙集; 区间型数据; 离散化; 相似度矩阵; 相似度阈值; 粗糙熵;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
针对条件属性取值为区间型数据的离散化问题,提出了一种新的基于粗糙集理论的离散化算法.首先将粗糙集理论中上、下近似的概念进行扩展,用以描述区间数对象间的距离和相似关系,并通过定义相似度阈值来确定对象间的相似关系.为了达到用最少的离散划分区间得到较好的离散化结果,并合理地确定相似度阈值,文章给出了粗糙熵的概念.通过离散化属性的上、下近似粗糙熵值的计算以及该属性下各区间数对象的相似度矩阵的确定,可以得到该属性下最终的离散化结果.最后给出了一个烟叶质量等级评价的实例,实验结果表明该算法是有效的.
引用
收藏
页码:157 / 165
页数:9
相关论文
共 11 条
[1]   区间型多属性决策求解新方法 [J].
谭旭 ;
高妍方 ;
陈英武 .
系统工程与电子技术, 2007, (07) :1082-1085
[2]   基于信息熵的粗糙集连续属性离散化算法 [J].
谢宏 ;
程浩忠 ;
牛东晓 .
计算机学报, 2005, (09) :1570-1574
[3]  
基于粗糙集的数据挖掘算法研究.[D].刘文军.北京师范大学.2004, 11
[4]   A grey-based rough approximation model for interval data processing [J].
Yamaguchi, Daisuke ;
Li, Guo-Dong ;
Nagai, Masatake .
INFORMATION SCIENCES, 2007, 177 (21) :4727-4744
[5]   Discretization: An enabling technique [J].
Liu, H ;
Hussain, F ;
Tan, CL ;
Dash, M .
DATA MINING AND KNOWLEDGE DISCOVERY, 2002, 6 (04) :393-423
[6]   Global discretization of continuous attributes as preprocessing for machine learning [J].
Chmielewski, MR ;
GrzymalaBusse, JW .
INTERNATIONAL JOURNAL OF APPROXIMATE REASONING, 1996, 15 (04) :319-331
[7]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356
[8]  
基于粗糙集的不确定决策.[M].张文修;仇国芳著;.清华大学出版社.2005,
[9]  
不确定多属性决策方法及应用.[M].徐泽水著;.清华大学出版社.2004,
[10]  
烟叶打叶复烤工艺与设备.[M].胡开文主编;.化学工业出版社.2002,