基于样例选取的属性约简算法

被引:28
作者
王熙照
王婷婷
翟俊海
机构
[1] 河北省机器学习与计算智能重点实验室河北大学数学与计算机学院
关键词
信息系统; 样例选取; 粗糙集; 差别矩阵; 属性约简;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
计算属性约简是粗糙集框架下归纳学习的关键部分.基于差别矩阵的属性约简算法是常用的属性约简算法之一.给定一个信息系统,利用该算法可以求出信息系统的所有属性约简.但是该算法需要的存储空间大,执行时间长,特别是对于大型数据库,差别矩阵的存储成为其应用的瓶颈.针对这一问题,提出了一种基于样例选取的属性约简算法,算法分为3步:首先从样例集中挑选出重要的样例;然后用选出的样例构造差别矩阵;最后计算信息系统的所有约简.实验结果显示,当处理大型数据库时,新算法能有效地减少存储空间和执行时间.
引用
收藏
页码:2305 / 2310
页数:6
相关论文
共 14 条
  • [1] 基于新的距离度量的K-Modes聚类算法
    梁吉业
    白亮
    曹付元
    [J]. 计算机研究与发展, 2010, (10) : 1749 - 1755
  • [2] 区间值信息系统的知识约简
    张楠
    苗夺谦
    岳晓冬
    [J]. 计算机研究与发展, 2010, (08) : 1362 - 1371
  • [3] 一种基于一致性准则的属性约简算法
    杨明
    [J]. 计算机学报, 2010, 33 (02) : 231 - 239
  • [4] 粗糙集理论与应用研究综述
    王国胤
    姚一豫
    于洪
    [J]. 计算机学报, 2009, 32 (07) : 1229 - 1246
  • [5] 一种隶属关系不确定的可能性模糊聚类方法
    陈健美
    陆虎
    宋余庆
    宋顺林
    徐景
    谢从华
    倪巍伟
    [J]. 计算机研究与发展, 2008, (09) : 1486 - 1492
  • [6] 一种基于改进差别矩阵的属性约简增量式更新算法
    杨明
    [J]. 计算机学报, 2007, (05) : 5815 - 5822
  • [7] 一种连续值属性约简方法ReCA
    商琳
    万琼
    姚望舒
    王金根
    陈世福
    不详
    [J]. 计算机研究与发展 , 2005, (07) : 1217 - 1224
  • [8] Reduction Algorithms Based on Discernibility Matrix:The Ordered Attributes Method
    王珏
    王驹
    [J]. Journal of Computer Science and Technology, 2001, (06) : 489 - 504
  • [9] Top 10 algorithms in data mining[J] . Xindong Wu,Vipin Kumar,J. Ross Quinlan,Joydeep Ghosh,Qiang Yang,Hiroshi Motoda,Geoffrey J. McLachlan,Angus Ng,Bing Liu,Philip S. Yu,Zhi-Hua Zhou,Michael Steinbach,David J. Hand,Dan Steinberg.Knowledge and Information Systems . 2009 (1)
  • [10] Rough sets and Boolean reasoning[J] . Information Sciences . 2006 (1)