一种可伸缩的快速属性约简算法

被引:6
作者
吴子特
叶东毅
机构
[1] 福州大学数学与计算机科学学院
关键词
粗糙集; 属性约简; 海量数据; 可伸缩性;
D O I
10.16451/j.cnki.issn1003-6059.2009.02.018
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
现有基于粗糙集的属性约简算法主要针对数据全部驻留在内存中的情况,因此算法不适合海量数据的约简计算、可伸缩性较差.本文借助SLIQ算法的思想并引入相应的一种数据预处理策略,由此提出一个快速的属性约简算法,其时间复杂性为O(|U||C|).实验结果表明该算法具有良好的可伸缩性.
引用
收藏
页码:234 / 239
页数:6
相关论文
共 9 条
[1]   二维表快速排序的复杂度分析 [J].
胡峰 ;
王国胤 .
计算机学报, 2007, (06) :963-968
[2]   一个基于差别矩阵的快速求核算法 [J].
徐章艳 ;
杨炳儒 ;
宋威 .
计算机工程与应用 , 2006, (06) :4-6
[3]   一种新的快速计算正区域的方法 [J].
刘少辉 ;
盛秋戬 ;
史忠植 .
计算机研究与发展, 2003, (05) :637-642
[4]   Rough集高效算法的研究 [J].
刘少辉 ;
盛秋戬 ;
吴斌 ;
史忠植 ;
胡斐 .
计算机学报, 2003, (05) :524-529
[5]   一个新的差别矩阵及其求核方法 [J].
叶东毅 ;
陈昭炯 .
电子学报, 2002, (07) :1086-1088
[6]   基于条件信息熵的决策表约简 [J].
王国胤 ;
于洪 ;
杨大春 .
计算机学报, 2002, (07) :759-766
[7]   Jelonek属性约简算法的一个改进 [J].
叶东毅 .
电子学报, 2000, (12) :81-82
[8]   RainForest—A Framework for Fast Decision Tree Construction of Large Datasets [J].
Johannes Gehrke ;
Raghu Ramakrishnan ;
Venkatesh Ganti .
Data Mining and Knowledge Discovery, 2000, 4 :127-162
[9]   ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356