融入软信息的P2P网络借贷违约预测方法

被引:28
作者
蒋翠清
王睿雅
丁勇
机构
[1] 合肥工业大学管理学院
关键词
P2P借贷; 违约预测; 软信息; 主题模型; 变量选择; 随机森林;
D O I
10.16381/j.cnki.issn1003-207x.2017.11.002
中图分类号
F724.6 [电子贸易、网上贸易]; F832.4 [信贷];
学科分类号
1201 ;
摘要
在P2P网络借贷中,预测借款的违约概率是用户信用评价的关键,也是借贷平台与投资者关注的重点问题。由于P2P平台所获取的用户财务信息有限,P2P借款信用评价和违约预测面临新的挑战。本文结合P2P平台的信息特点,提出一种融入软信息的网络借款违约预测方法。首先利用主题模型抽取并量化文本软信息中的相关变量,进而分析不同软信息变量对借款违约的影响关系;其次,设计了一种两阶段的变量选择方法对软硬信息进行组合筛选;最后,引入随机森林算法构建融入软信息的违约预测模型,并结合P2P平台的真实数据进行实证分析。结果表明,在P2P借款的违约预测模型中融入有价值的软信息可以提高预测准确率。
引用
收藏
页码:12 / 21
页数:10
相关论文
共 15 条
[11]   Improving the management of microfinance institutions by using credit scoring models based on Statistical Learning techniques [J].
Cubiles-De-La-Vega, Maria-Dolores ;
Blanco-Oliver, Antonio ;
Pino-Mejias, Rafael ;
Lara-Rubio, Juan .
EXPERT SYSTEMS WITH APPLICATIONS, 2013, 40 (17) :6910-6917
[12]  
Consumer credit risk: Individual probability estimates using machine learning[J] . Jochen Kruppa,Alexandra Schwarz,Gerhard Arminger,Andreas Ziegler.Expert Systems With Applications . 2013 (13)
[13]   Do Unverifiable Disclosures Matter? Evidence from Peer-to-Peer Lending [J].
Michels, Jeremy .
ACCOUNTING REVIEW, 2012, 87 (04) :1385-1413
[14]  
What's in a Picture?: Evidence of Discrimination from Prosper.com[J] . Devin Garett. Pope,Justin Reuel. Sydnor.Journal of Human Resources . 2011 (1)
[15]  
Multiple classifier architectures and their application to credit risk assessment[J] . Steven Finlay.European Journal of Operational Research . 2010 (2)