近红外光谱Elastic Net建模方法与应用

被引:10
作者
郑年年
栾小丽
刘飞
机构
[1] 江南大学自动化研究所轻工过程先进控制教育部重点实验室
关键词
近红外光谱; Elastic Net; Lasso; 可解释性; 预测精度;
D O I
暂无
中图分类号
O657.33 [红外光谱分析法];
学科分类号
070302 [分析化学];
摘要
当近红外光谱信息远大于样本量时,对光谱信息进行自动变量选择进而建立光谱与样品含量的稀疏线性模型重要且具有挑战性。利用近红外光谱,将变量选择方法 Elastic Net用于聚苯醚生产过程中微量成分邻甲酚的测量,建立近红外光谱与邻甲酚含量之间的定量校正模型,并将其模型预测效果与Lasso方法进行对比。在变量数目远远大于样本量的情形下,Lasso方法虽可实现变量选择,但由于对系数的过度压缩,使得模型的预测精度受到影响,而Elastic Net通过增加L2惩罚项避免了过多删失数据,可以提高模型预测精度。为了验证Elastic Net方法的模型性能指标,用复相关系数R2和调整的复相关系数R2a来评价模型的可解释性,利用平均相对预测误差MRPE(mean relative prediction error)和预测相关系数Rp来评价模型的预测精度。Lasso方法建立的模型性能指标为:R2=0.94,R2a=0.93,MRPE=4.51%,Rp=0.96;Elastic Net方法的性能指标为:R2=0.97,R2a=1,MRPE=3.25%,Rp=0.98。结果表明,Elastic Net所建立模型的性能指标优于Lasso方法,可以得到可解释性较强和预测精度较高的稀疏线性模型。
引用
收藏
页码:3096 / 3100
页数:5
相关论文
共 10 条
[1]
近红外全局隐含温度补偿模型的预测精度分析 [J].
史婷 ;
栾小丽 ;
刘飞 .
光谱学与光谱分析, 2017, 37 (04) :1058-1063
[2]
Lasso问题的最新算法研究 [J].
刘柳 ;
陶大程 .
数据采集与处理, 2015, 30 (01) :35-46
[3]
不同建模方法在茶汤中多酚含量近红外检测中的应用 [J].
刘冉 ;
杨晓丽 ;
徐云惠 ;
陈静 .
广州化工, 2013, 41 (15) :127-128+137
[4]
自变量个数远大于样本数情形下(p>>n)罚函数回归法的改进 [J].
张玉 .
江苏教育学院学报(自然科学版), 2012, 28 (03) :28-32
[5]
线性回归模型中变量选择方法综述 [J].
王大荣 ;
张忠占 .
数理统计与管理, 2010, 29 (04) :615-627
[6]
基于主成分分析和小波神经网络的近红外多组分建模研究.[J].汤守鹏;姚鑫锋;姚霞;田永超;曹卫星;朱艳;.分析化学.2009, 10
[7]
Variable selection for survival data with a class of adaptive elastic net techniques [J].
Khan, Md Hasinur Rahaman ;
Shaw, J. Ewart H. .
STATISTICS AND COMPUTING, 2016, 26 (03) :725-741
[8]
Improvement of NIR model by fractional order Savitzky–Golay derivation (FOSGD) coupled with wavelength selection.[J].Peijin Tong;Yiping Du;Kaiyi Zheng;Ting Wu;Jiajun Wang.Chemometrics and Intelligent Laboratory Systems.2015,
[9]
Rapid measurement of total polyphenols content in cocoa beans by data fusion of NIR spectroscopy and electronic tongue [J].
Huang, Xingyi ;
Teye, Ernest ;
Sam-Amoah, Livingstone K. ;
Han, Fangkai ;
Yao, Liya ;
Tchabo, William .
ANALYTICAL METHODS, 2014, 6 (14) :5008-5015
[10]
应用回归分析.[M].何晓群;刘文卿.中国人民大学出版社.2015,