高维特征选择方法在近红外光谱分类中的应用

被引:19
作者
秦玉华 [1 ,2 ]
丁香乾 [1 ]
宫会丽 [1 ]
机构
[1] 不详
[2] 中国海洋大学信息科学与工程学院
[3] 不详
[4] 青岛科技大学信息科学技术学院
[5] 不详
关键词
近红外光谱; 特征选择; 随机森林; 主成分分析; 卷烟;
D O I
暂无
中图分类号
O433.4 [光谱分析];
学科分类号
摘要
针对卷烟近红外光谱高噪和高冗余特点,提出了一种基于随机森林(RF)和主成分分析(PCA)的特征优选方法 RF-PCA,建立了5种不同质量级别卷烟的分类模型,并和其他方法进行了比较。该方法能够有效地对高维数据样本进行分类,用于甄别卷烟品质真伪。特征选择可以过滤与分类不相关的特征,而通过PCA方法可以消除冗余特征的不良影响,并可进一步降低特征维数。实验表明:RF-PCA方法能有效地剔除近红外光谱数据中的噪声特征和冗余特征,提高了分类效率。
引用
收藏
页码:1355 / 1359
页数:5
相关论文
共 6 条
  • [1] 卷烟真伪鉴别的近红外定性分析方法
    唐雪梅
    张薇
    李慧
    [J]. 烟草科技, 2008, (11) : 5 - 8
  • [2] PCA-SVR联用算法在近红外光谱分析烟草成分中的应用
    刘旭
    陈华才
    刘太昂
    李银玲
    陆治荣
    陆文聪
    [J]. 光谱学与光谱分析, 2007, (12) : 2460 - 2463
  • [3] Multivariate feature selection and hierarchical classification for infrared spectroscopy: serum-based detection of bovine spongiform encephalopathy[J] . Bjoern H. Menze,Wolfgang Petrich,Fred A. Hamprecht.Analytical and Bioanalytical Chemistry . 2007 (5)
  • [4] Random forests
    Breiman, L
    [J]. MACHINE LEARNING, 2001, 45 (01) : 5 - 32
  • [5] Applying artificial neural networks: Part II. Using near infrared data to classify tobacco types andidentify native grown tobacco[J] . Maha Hana,W. McClure,T. Whitaker,M. White,D. Bahler.Journal of Near Infrared Spectroscopy . 1997 (1)
  • [6] Bootstrap Methods for Standard Errors, Confidence Intervals, and Other Measures of Statistical Accuracy[J] . B. Efron,R. Tibshirani.Statistical Science . 1986 (1)