几种数据挖掘方法用于中医证候分析的对比研究

被引:46
作者
许玉龙 [1 ]
盛梦园 [1 ]
王哲 [1 ]
王晓辉 [1 ]
吕雅丽 [1 ]
修沁 [2 ]
机构
[1] 河南中医药大学信息技术学院
[2] 福建省汀州医院
关键词
层次聚类; 因子分析; 复杂网络; K-means; 中医证候;
D O I
暂无
中图分类号
R24 [中医临床学]; TP311.13 [];
学科分类号
100502 [中医临床基础];
摘要
目的探讨不同无监督数据分析方法分析中医证候的效果差异。方法基于临床采集的肝炎肝硬化患者中医症状数据,比较层次聚类、因子分析、复杂网络、K-means方法从症状和患者角度分析中医症状数据、挖掘其潜在规律、根据医学知识对数据分类及归纳得到证候的差异。结果从症状角度分析,层次聚类基于症状变量之间的距离关系进行聚类,能反映近似的症状从而推导出证候;因子分析用降维寻求少数潜在变量来综合反映原始指标的大部分信息,能反映出证候的主要症状。但这2种方法都无法将一症状同时归纳到多个证候,不适合临床实际中某症状属于多种证候的情况。复杂网络通过症状及症状的关系构建网络,较适合于对某种确定证候所涉及的症状进行分析,但不太适合对证候的推导与辨证。从患者角度分析,层次聚类和K-means对患者人群聚类后,可把相似的患者聚为一类,但不能同时从多个侧面进行聚类,即无法体现一个患者同时具有多种证候,不适合实际临床中的多种证候兼夹情况;对比专家组经验并分析频次发现,二者聚类结果一般。结论使用常规数据挖掘方法分析中医数据,在挖掘从症状到证候的关系时,单个方法能完成单一角度分析,但无法同时满足症状属于多种证候、患者具有多种证候的兼夹情况等多角度分析,需要改进或尝试采用新的方法研究从症状到证候的数据挖掘问题。
引用
收藏
页码:97 / 102
页数:6
相关论文
共 18 条
[1]
证候研究中常用数据分析方法的文献研究及基于隐类模型的抑郁症隐变量分析 [D]. 
蔡伟达 .
北京中医药大学,
2015
[2]
HIERARCHICAL CLUSTERING SCHEMES [J].
JOHNSON, SC .
PSYCHOMETRIKA, 1967, 32 (03) :241-254
[3]
数据挖掘中聚类分析算法的研究与应用 [D]. 
李仁义 .
电子科技大学,
2012
[4]
基于隐结构分析建立中医证候分型规则的三种方法 [J].
许玉龙 ;
吴秀艳 ;
李延龙 ;
王天芳 ;
张连文 ;
薛晓琳 .
世界科学技术-中医药现代化, 2019, 21 (01) :101-108
[5]
基于复杂网络的太阴中风证临床诊断指征筛选 [J].
刘佳佳 ;
林树元 ;
郑卫军 ;
曹灵勇 .
上海中医药杂志, 2018, 52 (12) :14-17
[6]
基于因子分析法的重症肺炎中医证候分布及演变规律研究 [J].
于小林 ;
张艳霞 ;
张晓梅 .
环球中医药, 2018, 11 (09) :1337-1342
[7]
基于因子分析的801例肝炎肝硬化患者的证候研究 [J].
李延龙 ;
吴秀艳 ;
王天芳 ;
薛晓琳 ;
赵丽红 ;
李昕 ;
李宁 .
辽宁中医杂志, 2018, 45 (04) :673-675
[8]
基于因子分析的支气管哮喘急性发作期患者中医证候 [J].
王强 ;
张弦 ;
王盛隆 ;
王伟 .
世界中西医结合杂志, 2017, 12 (12) :1637-1641
[9]
中医证候研究现状及证候中药研究关键 [J].
寇冠军 ;
唐健元 .
中药药理与临床 , 2017, (04) :213-214
[10]
K-means聚类算法研究综述 [J].
王千 ;
王成 ;
冯振元 ;
叶金凤 .
电子设计工程, 2012, (07) :21-24