一类基于信息熵的多标签特征选择算法

被引:64
作者
张振海
李士宁
李志刚
陈昊
机构
[1] 西北工业大学计算机学院
关键词
物联网; 数据处理; 信息论; 多标签分类; 特征选择; 信息增益; 特征降维;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的多标签特征选择算法.该算法假设特征之间相互独立,使用特征与标签集合之间的信息增益来衡量特征与标签集合之间的重要程度,并据此提出一种信息增益阈值选择方法.首先计算每一个特征与标签集合之间的信息增益,然后使用信息增益阈值选择算法得到一个合理的阈值,最后根据阈值删除不相关的特征,得到一组合理的特征子集.在2个不同分类器和4个多标签数据集上的实验结果表明:特征选择算法能够有效地提升多标签分类器的分类性能.
引用
收藏
页码:1177 / 1184
页数:8
相关论文
共 8 条
[1]   一种基于正则化的半监督多标记学习方法 [J].
李宇峰 ;
黄圣君 ;
周志华 .
计算机研究与发展, 2012, (06) :1272-1278
[2]   一种针对弱标记的直推式多标记分类方法 [J].
孔祥南 ;
黎铭 ;
姜远 ;
周志华 .
计算机研究与发展, 2010, (08) :1392-1399
[3]   一种基于随机游走模型的多标签分类算法 [J].
郑伟 ;
王朝坤 ;
刘璋 ;
王建民 .
计算机学报, 2010, 33 (08) :1418-1426
[4]   基于区分类别能力的高性能特征选择方法 [J].
徐燕 ;
李锦涛 ;
王斌 ;
孙春明 .
软件学报, 2008, (01) :82-89
[5]   Embedded Feature Selection for Multi-label Classification of Music Emotions [J].
You, Mingyu ;
Liu, Jiaming ;
Li, Guo-Zheng ;
Chen, Yan .
INTERNATIONAL JOURNAL OF COMPUTATIONAL INTELLIGENCE SYSTEMS, 2012, 5 (04) :668-678
[6]   Feature selection for multi-label naive Bayes classification [J].
Zhang, Min-Ling ;
Pena, Jose M. ;
Robles, Victor .
INFORMATION SCIENCES, 2009, 179 (19) :3218-3229
[7]   On applying linear discriminant analysis for multi-labeled problems [J].
Park, Cheong Hee ;
Lee, Moonhwi .
PATTERN RECOGNITION LETTERS, 2008, 29 (07) :878-887
[8]  
M L-KNN : A lazy learning approach to multi-label learning[J] . Min-Ling Zhang,Zhi-Hua Zhou.Pattern Recognition . 2007 (7)