超高维数据降维与Logistic广义线性拟合分析

被引:2
作者
王桂芝
宋迎曦
来鹏
陈纪波
机构
[1] 南京信息工程大学数学与统计学院
关键词
高维数据; Logistic回归; 广义线性模型; 降维; TCS算法;
D O I
10.13546/j.cnki.tjyjc.2016.07.009
中图分类号
F224 [经济数学方法];
学科分类号
0701 ; 070104 ;
摘要
文章以美国威斯康星州的乳腺癌调查数据为例,分别采用SIS和TCS算法对高维数据进行降维处理,尝试将改进的Logistic广义线性模型对降维后的变量进行拟合。再与传统的一般线性模型、Logistic广义线性模型相比,结果表明,基于算法降维后的Logistic广义线性模型预测误差更小,其中基于TCS算法降维后的广义线性模型在拟合中要明显优于SIS算法降维后的广义线性模型。
引用
收藏
页码:38 / 41
页数:4
相关论文
共 8 条
  • [1] 基于数据挖掘的网络广告评判
    彭宇翔
    来鹏
    [J]. 统计与决策, 2014, (21) : 86 - 88
  • [2] 基于二分类Logistic回归模型的企业网络营销统计分析
    郑峰
    [J]. 统计与决策, 2012, (23) : 194 - 196
  • [3] Logistic模型多重共线性问题的诊断及改进
    陶然
    [J]. 统计与决策, 2008, (15) : 22 - 25
  • [4] 高维数据降维的DCT变换
    胡永刚
    吴翊
    王洪志
    卜江
    [J]. 计算机工程与应用 , 2006, (32) : 21 - 23+30
  • [5] 多元线性回归模型中缺失数据填补方法的效果比较[D]. 袁中萸.中南大学. 2008
  • [6] 应用回归分析[M]. 中国人民大学出版社 , 何晓群, 2001
  • [7] High dimensional variable selection via tilting[J] . HaeranCho,PiotrFryzlewicz. Journal of the Royal Statistical Society: Series B (Statistical Methodology) . 2012 (3)
  • [8] Sure independence screening for ultrahigh dimensional feature space[J] . JianqingFan,JinchiLv. Journal of the Royal Statistical Society: Series B (Statistical Methodology) . 2008 (5)