基于最大熵原理的空间特征选择方法

被引:18
作者
宋国杰
唐世渭
杨冬青
王腾蛟
机构
[1] 北京大学计算机科学技术系
[2] 北京大学计算机科学技术系 北京
[3] 北京
[4] 北京大学视觉与听觉信息处理国家重点实验室
关键词
空间数据挖掘; 空间特征选择; 最大熵理论; 互信息; 决策树;
D O I
10.13328/j.cnki.jos.2003.09.006
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
特征选择在模式识别和数据挖掘等领域都有十分广泛的应用.然而,当涉及空间数据时,由于传统特征选择方法没有很好地考虑数据的空间特性,所以会导致特征选择结果性能下降.从空间数据本身的特性出发,提出一种特征选择方法MEFS(maximum entropy feature selection).MEFS在基于最大熵原理的基础上,运用互信息和Z-测试技术,采用两步方法进行空间特征选择.第1步,空间谓词选择;第2步,选择与每个空间谓词对应的相关属性集.最后,分别对MEFS方法和RELIEF方法以及基于MEFS的分类方法与决策树算法ID3分别进行了实验比较.实验结果表明,MEFS方法不仅可以节约特征提取和分类时间,而且也极大地提高了分类质量.
引用
收藏
页码:1544 / 1550
页数:7
相关论文
共 1 条
[1]  
Wrappers for feature subset selection[J] . Ron Kohavi,George H. John.Artificial Intelligence . 1997 (1)