基于后关系型数据库的医疗体检数据挖掘的研究与应用

被引:0
作者
郑旭军
机构
[1] 华东师范大学
关键词
数据挖掘; 决策树; 遗传算法; 医疗; Caché;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
目前全世界已有成千上万个数据库系统在运行,几乎涉及人类社会生活的方方面面,无论是企事业内部的信息管理,还是各个行业的业务处理系统,以及一般的信息加工和情报检索无不以数据库技术为基础。而医疗领域由于其具有的医疗层次关系复杂、环节众多以及医疗数据结构的多维性等特点,使得采用传统的关系型数据库难以模拟出复杂的数据关系,并且存在着存取效率的问题。 同时随着医疗卫生领域中计算机技术的迅速发展,大量有关于病人的病史、诊断、检验和治疗的临床信息,以及药品管理信息、医院管理信息等医疗信息可以被精确地记录下来,从而导致医疗数据资料爆炸性增长,如何从这些海量的医疗数据中,挖掘出有用的信息,了解各种疾病之间的相互关系和各种疾病的发展规律,总结各种治疗方案的治疗效果,这将对疾病的诊断、治疗和医学研究具有重大意义。·针对医疗领域数据的特点,本文利用Cache数据库所具有的面向对象以及多维数据结构的技术优势,将其作为数据挖掘的平台,并提出基于贝叶斯定理的损失评分函数,对医疗评价指标进行改进。同时构造了基于该损失评分函数作为遗传算法的适应度函数,并将该遗传算法与决策树算法相结合构建了混合算法(C4.5/GA),该混合算法可以改进决策树算法偏向于大数据集以及遗传算法训练时间过长的不足。通过构建的混合算法对医疗体检数据进行数据挖掘,并采用基于贝叶斯定理的损失评分函数作为医疗评价指标对医疗体检数据的模型进行评估,以发现高血压与个人的饮食结构、生活习惯、生活方式等方面的关系或规律,为降低高血压的患病率提供一定的帮助。
引用
收藏
页数:73
共 12 条
[1]
新型医院信息系统的构建与实现 [J].
郭幽燕 ;
王辅国 ;
韩向非 .
计算机工程, 2004, (06) :182-183+188
[2]
医学数据挖掘的技术、方法及应用.[J].朱凌云;吴宝明.生物医学工程学杂志.2003, 03
[3]
生物医学数据挖掘 [J].
胡文丰 ;
张正国 .
国外医学(生物医学工程分册), 2003, (01) :11-15
[4]
计算机辅助医学诊断系统的数据挖掘和知识发现研究 [J].
瞿爱珍 ;
庄天戈 .
国外医学生物医学工程分册., 2002, (03) :97-103
[5]
数据采掘及其在医学研究中的应用 [J].
崔雷 .
情报理论与实践, 2001, (05) :368-370+333
[6]
机器学习.[M].(美)TomM.Mitchell著;曾华军;张银奎等译;.机械工业出版社.2003,
[7]
模式分类.[M].(美)RichardO.Duda等著;李宏东;姚天翔等译;.机械工业出版社.2003,
[8]
贝叶斯统计.[M].茆诗松编著;.中国统计出版社.1999,
[9]
基于决策树的分类算法研究.[D].胡江洪.武汉理工大学.2006, 08
[10]
基于神经网络的医疗数据挖掘研究 [D]. 
蒋良孝 .
中国地质大学,
2004