学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
缺失数据处理方法的比较研究
被引:118
作者
:
论文数:
引用数:
h-index:
机构:
刘鹏
雷蕾
论文数:
0
引用数:
0
h-index:
0
机构:
上海财经大学经济信息管理系,上海财经大学经济信息管理系,上海财经大学经济信息管理系上海,上海,上海
雷蕾
张雪凤
论文数:
0
引用数:
0
h-index:
0
机构:
上海财经大学经济信息管理系,上海财经大学经济信息管理系,上海财经大学经济信息管理系上海,上海,上海
张雪凤
机构
:
[1]
上海财经大学经济信息管理系,上海财经大学经济信息管理系,上海财经大学经济信息管理系上海,上海,上海
来源
:
计算机科学
|
2004年
/ 10期
关键词
:
数据挖掘;
缺失值;
朴素贝叶斯分类器;
信息增益;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
摘要
:
数据挖掘已被广泛用于医疗领域,而大多数医疗数据集都存在缺失值。本文介绍了一些缺失值估计算法。建立了5种模型来提高预测的有效性,它们是保留缺失模型、直接丢弃模型、贝叶斯朴缺模型、贝叶斯重叠补缺模型和基于信息增益的贝叶斯重叠补缺模型。这些模型在Clinics数据集上进行了处理和分析。用C4.5决策树和10叠交叉确认法来检验这些模型的性能,结果表明根据信息增益递减顺序排序,用朴素贝叶斯分类器来预测缺失值是有效的。
引用
收藏
页码:155 / 156+174 +174
页数:3
相关论文
未找到相关数据
未找到相关数据