变量筛选后的个人信贷评分模型与统计学习

被引:10
作者
陈秋华
杨慧荣
崔恒建
机构
[1] 首都师范大学数学科学学院
关键词
信用评分; 统计学习; 变量筛选; MV指数; GLM;
D O I
10.13860/j.cnki.sltj.20200223-002
中图分类号
F831.2 [金融组织与业务]; F224 [经济数学方法];
学科分类号
0701 ; 070104 ;
摘要
如何通过构建可靠的信用评分模型来评估贷款申请人的信用风险在信贷风险管理行业中发挥着重要的作用,这也成为学术界和商业界的一项重要研究课题。本文通过先筛选数据变量,然后再建立模型的方法,探讨了3种不同连接函数下广义线性模型的分类问题,并且当连接函数为logit (对应logistic回归模型)时,加入了自变量的交互项以优化模型。以德国UCI数据集为例,采用AUC和KS指标作为评价指标,与随机森林、支持向量机和XGBoost模型等目前信贷评分中最常用的统计学习模型进行了分析对比,结果表明:广义线性模型中logistic回归模型和SVM预测效果尚佳;对于连接函数为logit的广义线性模型,加入交互项后AUC和KS有所提高,表明交互项的加入优化了模型。
引用
收藏
页码:368 / 380
页数:13
相关论文
共 24 条