微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究

被引:2
作者
陈江鹏
彭斌
文雯
唐小静
文小焱
胡珊
机构
[1] 重庆医科大学公共卫生与管理学院卫生统计与信息管理教研室
关键词
变量选择; LASSO算法; 模拟;
D O I
暂无
中图分类号
R195.1 [卫生统计学];
学科分类号
摘要
目的探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和overlap group LASSO(简称为og LASSO)变量选择的影响。结果经典的LASSO、og LASSO变量选择方法在处理模拟微阵列数据时具有较好的预测精度(AUCLASSO=0.8915≈AUCog LASSO=0.8923>AUCnog LASSO=0.8396,MSEnog LASSO=0.1358>MSEog LASSO=0.0975≈MSELASSO=0.0928),LASSO可解释性最强(平均入选模型基因数分别为21.52、111.95、101.01)。nog LASSO在处理基因通路信息时,当[X295]被错分至第19个通路后,尽管未改变其效应值,但入选模型次数大为减少,预测精度下降较为明显,而og LASSO表现更稳健。结论融合微阵列数据中的先验信息并未提高基于LASSO变量选择方法的预测性能及效率,经典的LASSO变量选择方法仍为处理微阵列数据的有效方法。
引用
收藏
页码:407 / 409+413 +413
页数:4
相关论文
共 3 条
  • [1] 高维数据回归分析中基于LASSO的自变量选择
    张秀秀
    王慧
    田双双
    乔楠
    闫丽娜
    王彤
    [J]. 中国卫生统计, 2013, (06) : 922 - 926
  • [2] Model selection and estimation in regression with grouped variables[J] . MingYuan,YiLin. Journal of the Royal Statistical Society: Series B (Statistical Methodology) . 2005 (1)