基于文献数据的疾病与基因关联关系研究

被引:3
作者
牟冬梅
金姗
琚沅红
机构
[1] 吉林大学公共卫生学院
关键词
实体识别; 信息抽取; 聚类分析; 基因关联关系;
D O I
暂无
中图分类号
G254 [文献标引与编目]; R318 [生物医学工程];
学科分类号
0831 ;
摘要
【目的】通过对文献摘要数据进行挖掘实现知识发现,发现疾病关联基因及其规律,为疾病的预防与治疗提供依据。【方法】采用基于词典的实体识别技术,构建实体抽取规则,提出疾病与基因实体间关联关系发现模型。选取糖尿病肾病相关摘要对模型进行验证,应用聚类分析方法对疾病关联基因进行分析,根据聚类结果采用回溯分析的方法回溯至原摘要讨论。【结果】获得656个糖尿病肾病关联基因,根据聚类分析结果,将关联基因分为三类,其中频次为26的基因为高频基因,11到19的为中频基因,1到10的为低频基因。【局限】实验数据选取有限,仅选取糖尿病肾病进行实验,未来可选取其他糖尿病并发症进行实验与对比分析。【结论】(1)疾病的高频基因可能是当前研究的理论依据;(2)中频基因是当前研究的热点;(3)低频基因是可能的知识发现,未来可能进一步发展成为研究热点。
引用
收藏
页码:98 / 106
页数:9
相关论文
共 17 条
[1]  
基于UMLS和通路数据的潜在语义分析技术的研究与实现.[D].尚美辰.黑龙江大学.2015, 03
[2]  
基于生物医学文本挖掘技术的天然产物的靶标蛋白预测.[D].舒刚.复旦大学.2012, 03
[3]  
Disorder recognition in clinical texts using multi-label structured SVM.[J].Wutao Lin;Donghong Ji;Yanan Lu.BMC Bioinformatics.2017, 1
[4]   An adaptive annotation approach for biomedical entity and relation recognition [J].
Yimam S.M. ;
Biemann C. ;
Majnaric L. ;
Šabanović Š. ;
Holzinger A. .
Brain Informatics, 2016, 3 (3) :157-168
[5]   Partial nephrogenic diabetes insipidus caused by a novel AQP2 variation impairing trafficking of the aquaporin-2 water channel [J].
Dollerup, Pia ;
Thomsen, Troels Moller ;
Nejsum, Lene N. ;
Faerch, Mia ;
Osterbrand, Martin ;
Gregersen, Niels ;
Rittig, Soren ;
Christensen, Jane H. ;
Corydon, Thomas J. .
BMC NEPHROLOGY, 2015, 16
[6]   APOL1 Kidney Disease Risk Variants: An Evolving Landscape [J].
Dummer, Patrick D. ;
Limou, Sophie ;
Rosenberg, Avi Z. ;
Heymann, Jurgen ;
Nelson, George ;
Winkler, Cheryl A. ;
Kopp, Jeffrey B. .
SEMINARS IN NEPHROLOGY, 2015, 35 (03) :222-236
[7]   A New Face and New Challenges for Online Mendelian Inheritance in Man (OMIM®) [J].
Amberger, Joanna ;
Bocchini, Carol ;
Hamosh, Ada .
HUMAN MUTATION, 2011, 32 (05) :564-567
[8]  
Irisin及其基因多态性与中国人2型糖尿病相关临床性状及微血管并发症的关系.[D].唐珊珊.上海交通大学.2015, 02
[9]  
2型糖尿病大血管并发症中血管平滑肌细胞增殖相关基因DNA甲基化的作用研究.[D].徐哲奕.华中科技大学.2014, 07
[10]   糖尿病肾病的发病机制及治疗进展 [J].
余翠 ;
熊钱颖 ;
王李卓 ;
高家林 .
医学综述, 2015, 21 (21) :3944-3947