基于不平衡样本的互联网个人信用评估研究

被引:20
作者
李毅 [1 ,2 ]
姜天英 [1 ]
刘亚茹 [1 ]
机构
[1] 山西财经大学统计学院
[2] 中国人民大学统计学院
关键词
互联网征信; 不平衡样本; 重抽样; 随机森林;
D O I
暂无
中图分类号
C829.2 [中国];
学科分类号
020208 ; 0714 ;
摘要
国内互联网金融和消费信贷的迅猛发展,催生了互联网个人征信的巨大需求。针对不平衡的互联网征信数据,采用随机过抽样、随机欠抽样和SMOTE方法进行数据平衡化,并建立决策树、支持向量机和随机森林等分类模型对互联网个人信用评估进行研究,结果表明:互联网大数据背景下的个人信用评估研究具有可行性;过抽样方法可以较好地提高互联网个人信用评估模型的分类性能;构建信用等级较好用户的一般特质,即年龄在18~30岁之间、工资水平在2 000元以上、用户页面浏览量多集中在10~20次之间和申请贷款时间相对较早等。在对互联网个人信用评估中变量有效性进行探索的基础上,反驳了"采用的变量越多结果就越准确"的说法。
引用
收藏
页码:84 / 90
页数:7
相关论文
共 4 条
[1]   大数据背景下网络借贷的信用风险评估——以人人贷为例 [J].
柳向东 ;
李凤 .
统计与信息论坛, 2016, 31 (05) :41-48
[2]   基于AUC回归的不平衡数据特征选择模型研究 [J].
李扬 ;
李竟翔 ;
王园萍 .
统计与信息论坛, 2015, 30 (05) :10-16
[3]   Credit scoring using the clustered support vector machine [J].
Harris, Terry .
EXPERT SYSTEMS WITH APPLICATIONS, 2015, 42 (02) :741-750
[4]  
Credit scoring models for the microfinance industry using neural networks: Evidence from Peru[J] . Antonio Blanco,Rafael Pino-Mejías,Juan Lara,Salvador Rayo.Expert Systems With Applications . 2013 (1)