Hash快速属性约简算法

被引:34
作者
刘勇
熊蓉
褚健
机构
[1] 浙江大学工业控制国家重点实验室
[2] 浙江大学智能系统与控制研究所
基金
浙江省自然科学基金;
关键词
粗糙集; 正区域; 约简; Hash; 不一致度;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
从决策系统的不一致情况出发,给出了不一致度的概念及其性质,并证明了不一致记录与正区域的等价关系.在此基础上,提出了基于Hash的正区域计算方法,时间复杂度下降为O(|U|);利用不一致情况的性质设计了一个基于不一致记录数的属性重要性测量参数,用新的测量参数设计了一个基于二次Hash的约简算法,其复杂度下降为O(|C|2|U/C|),并证明采用该测量参数所获得约简的完备性.最后通过实验证明该文正区域算法和约简算法的高效性.
引用
收藏
页码:1493 / 1499
页数:7
相关论文
共 5 条
[1]   Rough集高效算法的研究 [J].
刘少辉 ;
盛秋戬 ;
吴斌 ;
史忠植 ;
胡斐 .
计算机学报, 2003, (05) :524-529
[2]   不协调目标信息系统的知识约简 [J].
张文修 ;
米据生 ;
吴伟志 .
计算机学报, 2003, (01) :12-18
[3]   Rough set-aided keyword reduction for text categorization [J].
Chouchoulas, A ;
Shen, Q .
APPLIED ARTIFICIAL INTELLIGENCE, 2001, 15 (09) :843-873
[4]   Using rough sets with heuristics for feature selection [J].
Zhong, N ;
Dong, J ;
Ohsuga, S .
JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 2001, 16 (03) :199-214
[5]  
Selection of relevant features and examples in machine learning[J] . Avrim L. Blum,Pat Langley.Artificial Intelligence . 1997 (1)