基于随机森林和多标记学习算法的慢性胃炎实证特征选择和证候分类识别研究

被引:20
作者
徐玮斐 [1 ]
顾巍杰 [1 ]
刘国萍 [1 ]
刘晏 [2 ]
颜建军 [3 ]
钟涛 [3 ]
机构
[1] 上海中医药大学基础医学院
[2] 上海市中医医院脾胃病科
[3] 华东理工大学机械动力学院
关键词
随机森林算法; 多标记学习算法; 慢性胃炎; 特征选择; 证候;
D O I
暂无
中图分类号
R259 [现代医学内科疾病];
学科分类号
100506 ;
摘要
目的对慢性胃炎实证证候的特征症状进行选择,并建立证候模型,为慢性胃炎证候量化诊断的建立提供方法学参考。方法运用慢性胃炎中医问诊规范化量表采集临床症状和体征,并运用机器学习领域新提出的随机森林和多标记学习算法对慢性胃炎的实证症状进行选择和模型构建。结果运用随机森林和信息增益算法,结合多标记学习算法对证候分别建模,随机森林算法挑选出15个特征症状,信息增益方法挑选出20个特征症状,二者的模型最高准确率分别为83%、82%。通过评价,随机森林算法选出的特征症状更加精简,提高了诊断模型的识别率。结论随机森林结合多标记学习算法可实现慢性胃炎实证证候特征症状的选择,同时还可解决几个证候相兼问题,弥补传统学习算法的不足。
引用
收藏
页码:18 / 23
页数:6
相关论文
共 7 条
[1]   中医心系问诊量表的研制及评价 [J].
刘国萍 ;
王忆勤 ;
董英 ;
赵耐青 ;
许朝霞 ;
李福凤 ;
燕海霞 ;
钱鹏 ;
郭睿 ;
张晓丹 ;
邸丹 .
Journal of Integrative Medicine, 2009, (01) :20-24
[2]   从主观症状的客观规律探索中医证候分类的科学基础 [J].
吕爱平 ;
李梢 ;
王永炎 .
中医杂志, 2005, (01) :4-6
[3]   抓主症方法的认识与运用 [J].
傅延龄 ;
刘渡舟 .
中国医药学报, 1993, (04) :43-44
[4]  
中国慢性胃炎共识意见(2006年,上海)[J]. 中华消化内镜杂志. 2007 (01)
[5]  
中药新药临床研究指导原则[M]. 中国医药科技出版社 , 郑筱萸主编, 2002
[6]   Random forests [J].
Breiman, L .
MACHINE LEARNING, 2001, 45 (01) :5-32
[7]  
Introduction and application of random forest on high though put screening data from drug discovery. REMLINGER K. http://www4.ncsu.edu/ksremlin . 2014