基于MapReduce的中药数据网络化及挖掘

被引:0
作者
刘正
机构
[1] 南京大学
关键词
中药数据挖掘; 复杂网络分析; MapReduce;
D O I
暂无
年度学位
2012
学位类型
硕士
导师
摘要
中药数据挖掘是研究中药复方配伍规律的一项重要应用,其常用的数据挖掘模型都是基于事务项的,即把复方看成由多种药物组成的事务并储存在事务数据库中。虽然采用事务项模型的确可以发现大量中药配伍规律知识,但是不利于药物间关系的显式分析以及配伍规律的深层次挖掘。 本文从网络图模型的角度出发尝试建立药物复杂网络模型,利用现有中药复方数据组建中药药物网络,然后在该网络图上应用复杂网络分析算法显式研究药物间关系,而且亦可深层次挖掘中药配伍规律。论文的主要工作如下: 1)针对药物如何组图的问题提出了药物节点间度量,依照该度量将中药复方数据组成中药药物网络图,并且深入研究该网络图的特点,特别是对药物节点度数的分析,发现中药药物网络具有很多复杂网络的特性; 2)为了发现中药药物网络图中的关键性节点,并分析指定药物节点的依赖性,本文分别采用了PageRank算法和中介中心性中的依赖度计算算法; 3)采用改进的同步更新标签传播算法来挖掘网络图中的药物社团,以发现药性相似、社团内部相对频繁组方的药物组; 4)为了能在较大中药复方数据集中快速进行组图并挖掘,本文基于MapReduce编程模型改写算法,而且所有算法均在Hadoop平台下测试运行。
引用
收藏
页数:78
共 21 条
[1]
Power-Law Distributions in Empirical Data [J].
Clauset, Aaron ;
Shalizi, Cosma Rohilla ;
Newman, M. E. J. .
SIAM REVIEW, 2009, 51 (04) :661-703
[2]
Emergence of communities in weighted networks [J].
Kumpula, Jussi M. ;
Onnela, Jukka-Pekka ;
Saramaki, Jari ;
Kaski, Kimmo ;
Kertesz, Janos .
PHYSICAL REVIEW LETTERS, 2007, 99 (22)
[3]
Near linear time algorithm to detect community structures in large-scale networks..[J].Raghavan Usha Nandini;Albert Réka;Kumara Soundar.Physical review. E; Statistical; nonlinear; and soft matter physics.2007, 3 Pt 2
[4]
Uncovering the overlapping community structure of complex networks in nature and society [J].
Palla, G ;
Derenyi, I ;
Farkas, I ;
Vicsek, T .
NATURE, 2005, 435 (7043) :814-818
[5]
Finding community structure in very large networks..[J].Clauset Aaron;Newman M E J;Moore Cristopher.Physical review. E; Statistical; nonlinear; and soft matter physics.2004, 6 Pt 2
[6]
Detecting community structure in networks [J].
Newman, MEJ .
EUROPEAN PHYSICAL JOURNAL B, 2004, 38 (02) :321-330
[7]
Community structure in social and biological networks [J].
Girvan, M ;
Newman, MEJ .
PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, 2002, 99 (12) :7821-7826
[8]
A faster algorithm for betweenness centrality*.[J].Ulrik Brandes.The Journal of Mathematical Sociology.2001, 2
[9]
Graph structure in the Web.[J].Andrei Broder;Ravi Kumar;Farzin Maghoul;Prabhakar Raghavan;Sridhar Rajagopalan;Raymie Stata;Andrew Tomkins;Janet Wiener.Computer Networks.2000, 1