数据挖掘分类算法在冠心病临床应用的比较

被引:17
作者
陈建新 [1 ]
西广成 [1 ]
王伟 [2 ]
赵慧辉 [2 ]
陈静 [1 ]
机构
[1] 中国科学院自动化研究所复杂系统与智能科学重点实验室
[2] 北京中医药大学
关键词
对比研究; 数据挖掘算法; Logistic回归; 冠心病; 证候;
D O I
暂无
中图分类号
R541.4 [冠状动脉(粥样)硬化性心脏病(冠心病)];
学科分类号
1002 ; 100201 ;
摘要
证候是中医理论的核心。准确判定冠心病患者属于何种证候是中医有效治疗的重要前提。本文中,基于冠心病临床流行病学调查得到的1069例中医四诊信息和相应的辨证结果数据,用四类数据挖掘方法和一类统计方法作为预测模型对其学习和预测。采用十倍交叉验证方法得到的三个指标——敏感性,特异性和正确率以及运行时间来衡量算法的性能,并从每类方法中选择一个最优者进行对比研究。运行结果显示Bayes-ian network是贝叶斯方法中性能最好的,敏感性90.17%,特异性88.89%,正确率89.24%,运行时间0.53 s;径向基神经网络(RBFN)是神经网络中最好的,敏感性84.07%,特异性94.32%,正确率91.49%,运行时间1.03 s;L ibsvm是支持向量机(SVM)方法中最好的,敏感性91.19%,特异性93.15%,正确率92.61%,运行时间1.0 s;ADTree是决策树方法中最好的,敏感性83.73%,特异性95.99%,正确率92.61%,运行时间2.78 s;Logis-tic回归的敏感性是88.14%,特异性94.44%,正确率是92.70%,运行时间1.09 s。综合各项性能指标,SVM最好,Logistic回归次之,决策树、贝叶斯和神经网络依次次之。本文的对比研究为准确判别冠心病的中医证候提供适宜的数据挖掘方法。
引用
收藏
页码:249 / 252
页数:4
相关论文
共 4 条
[1]   多元统计方法在建立证候诊断模型研究中存在问题的思考 [J].
袁世宏 ;
王天芳 .
北京中医药大学学报, 2004, (04) :9-11
[2]   冠心病血瘀证逐步回归分析 [J].
王阶 ;
陈可冀 ;
翁维良 .
中西医结合杂志, 1991, (01) :47-49
[3]  
Yi Feng,Zhaohui Wu,Xuezhong Zhou,Zhongmei Zhou,Weiyu Fan.Knowledge discovery in traditional Chinese medicine: State of the art and perspectives[J].Artificial Intelligence In Medicine,2006(3)
[4]   Random Forests [J].
Leo Breiman .
Machine Learning, 2001, 45 :5-32