基于非参数密度估计的异常点诊断方法

被引:4
作者
吴武清 [1 ]
安愫宁 [1 ]
蒋勇 [2 ]
陈敏 [3 ]
机构
[1] 中国人民大学商学院
[2] 中国人民银行征信中心
[3] 中国科学院数学与系统科学研究院
关键词
异常点诊断; 纳税评估; 非参数密度估计; 局部域相关积分;
D O I
暂无
中图分类号
O212.7 [非参数统计];
学科分类号
070103 [概率论与数理统计];
摘要
异常点诊断是统计学中的经典问题.发现并减少异常点对纳税评估数据分析的影响是一项很有意义的研究.然而,通常的异常点诊断一般采用适用于单峰分布的全局识别方法.借鉴局部域相关积分(Local correlation integral)理论,提出基于非参数密度估计的识别方法.方法适用于多峰分布,能识别局域性质的异常点,对异常点占比较高的样本也有较强的识别能力.基于某市10 920个企业样本,实证分析对比研究了税务局目前使用的和建议的纳税评估方法,结果表明税务局采用的方法有较大的纳税评估风险(误判风险).
引用
收藏
页码:141 / 149
页数:9
相关论文
empty
未找到相关数据