数据挖掘在2型糖尿病数据处理中的应用

被引:12
作者
罗森林
成华
顾毓清
张铁梅
曾平
陈峰
机构
[1] 北京理工大学
[2] 中国科学院软件技术研究所
[3] 卫生部北京老年医学研究所
[4] 南京医科大学流行病与卫生统计学系 北京
[5] 北京
[6] 南京
关键词
数据挖掘; C4.5算法; 知识发现; 2型糖尿病;
D O I
10.16208/j.issn1000-7024.2004.11.007
中图分类号
TP399 [在其他方面的应用];
学科分类号
081203 ; 0835 ;
摘要
基于大量实测数据探索2型糖尿病的发病规律,寻求其有效的数据处理方法。将数据挖掘技术引入到2型糖尿病数据处理中得出决策分类树,再同医学认识相对照。利用11400条实测数据,采用C4.5算法得出分类树,经实验患病人群的正确识别率为80.90%,未患病人群的正确识别率为92.05%。给出的决策分类树同目前医学上认识的高危因素趋于一致,同时给出了血糖值等于5.85的临界性数值。数据挖掘方法的引入为2型糖尿病数据处理提供了一种新的方法,为其预警、干预和有效控制提供了一种新的解决方案。
引用
收藏
页码:1888 / 1892
页数:5
相关论文
共 2 条
[1]  
简明生物信息学[M]. - 高等教育出版社 , 马坚等编写, 2001
[2]  
Induction of decision trees[J] . J. R. Quinlan.Machine Learning . 1986 (1)