回归模型中哑变量的相对重要性指数

被引:5
作者
李海超 [1 ,2 ]
王开军 [1 ,2 ]
胡淼 [1 ,2 ]
陈黎飞 [1 ,2 ]
机构
[1] 福建师范大学数学与信息学院
[2] 福建省网络安全与密码技术重点实验室(福建师范大学)
关键词
定性属性; 回归方程; 哑变量; 指数;
D O I
暂无
中图分类号
O212.1 [一般数理统计];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
为在回归模型中描述定性属性,通常需要引入哑变量。对含哑变量的回归方程,提出描述不同哑变量在回归方程中不同重要程度的方法。该方法分解出含哑变量的回归方程中哑变量部分和非哑变量部分的回归平方和,计算这两部分在该回归方程中所起作用的占比,将该占比设计为各哑变量在回归方程中的相对重要程度指数。在近10万笔的Lending Club和Prosper网络借贷数据集上,所进行的挖掘借款用途对借款成功率、信用等级对借款利率的影响程度的实验结果表明,与传统回归方程仅提供哑变量前的系数却不能展现其重要程度相比,所提方法展现出不同哑变量的不同重要程度,为定量分析回归方程中定性自变量对因变量的影响程度提供了重要的手段。
引用
收藏
页码:3048 / 3052
页数:5
相关论文
共 18 条
[1]  
The Use of Regression on Dummy Variables in Management Research[J] . S. R. Searle,Jon G. Udell. &nbspManagement Science . 1970 (6)
[2]  
Use of dummy variables in regression equations. DB Suits. Journal of the American Statistical Association . 1957
[3]  
Regression shrinkage and selection via the lasso:a retrospective. Tibshirani R. Journal of the Royal Statistical Society:Series B . 2011
[4]  
Use of dummy variables in regression analysis. LEISTRITZ F L. Agricultural Economic Miscellaneous Report Technical,Agricultural Experiment Station,North Dakota State University . 1973
[5]  
Regression with Dummy Variables. HARDY M A. . 1993
[6]  
Dummy variables and their interactions in regression analysis:examples from research on body mass index. GROTENHUIS M T,THIJS P. http://www.ru.nl/publish/pages/780171/table1-4.pdf . 2016
[7]  
Application of dummy variables in multiple regression analysis. USMAN A U,ABDULKADIR H S,TUKUR K. Recent Scientific Research . 2015
[8]  
The impact of the financial crisis and natural catastrophes on CAT bonds. GURTLER M,HIBBELN M,WINKELVOS C. Journal of Risk and Insurance . 2016
[9]  
The use of dummy variables in regression analysis. SKRIVANEK S. https://www.moresteam.com/WhiteP apers/download/dummy-variables.pdf . 2016
[10]  
Angels and venture capitalists:substitutes or complements?. HELLMANN T F,SCHURE P,VO D. . 2015