分布式数据库查询算法的改进与应用

被引:0
作者
陈复兴
机构
[1] 江西师范大学
关键词
分布式数据库; 查询优化; SDD-1算法; 遗传算法; 多连接;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
近几十年来,大数据像洪水一样涌入我们的生活,分布式数据库的研究再次成为数据时代的热点,而分布式数据库查询算法一直是衡量一个分布式数据库特点的重要指标。传统分布式数据库查询算法对于单连接查询虽然能满足现大数据查询要求,但对于多连接查询还是不尽人意。而大数据时代是一个各个学科交叉的集合,对多连接查询的要求越来越高。对传统分布式数据库多连接查询算法的改进已经迫在眉睫了。 论文首先研究了分布式数据库查询基本理论,然后详细研究了分布式SDD-1查询算法和遗传算法技术,并对这两算法的关键技术进行了延伸和改进。结合分布式数据库多连接查询和改进之后的分布式SDD-1查询算法和遗传算法的特点,分别提出基于并行的SDD-1查询算法和基于改进的遗传算法,经过大量的试验表明,两种算法对分布式多连接查询的应用有很好的效果,查询成本大大降低。 论文主要工作可概括以下几个方面: (1)系统研究了分布式数据库的查询理论、常用查询优化技术及分布式查询算法分类及应用场景。 (2)通过对分布式查询理论及算法的研究,针对SDD-1算法处理多连接查询时生成最优查询计划时间较长的不足,提出了一种基于并行的SDD-1查询算法。此算法在收益评估和站点装配阶段均采用并行思想。实验数据证明,此算法明显减少了生成最优查询计划的时间,提高了算法的效率。 (3)通过对分布式查询理论及算法的研究,针对传统遗传查询算法生成最优查询计划有时非实际最优查询计划的不足,提出一种改进遗传查询算法。改进遗传查询算法由只选择一种交叉和变异概率,到采用K-均值聚类算法使多种交叉和变异概率同时存在。实验数据证明,改进后的算法提高了生成最优查询计划是实际上最优查询计划的概率,提高了算法的效率。
引用
收藏
页数:67
共 26 条
[1]
A simple and fast algorithm for K-medoids clustering.[J].Hae-Sang Park;Chi-Hyuck Jun.Expert Systems With Applications.2008, 2
[2]
The global k -means clustering algorithm.[J].Aristidis Likas;Nikos Vlassis;Jakob J. Verbeek.Pattern Recognition.2002, 2
[3]
Extensions to the k-means algorithm for clustering large data sets with categorical values [J].
Huang, ZX .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (03) :283-304
[4]
An effective genetic algorithm approach to the quadratic minimum spanning tree problem [J].
Zhou, GG ;
Gen, M .
COMPUTERS & OPERATIONS RESEARCH, 1998, 25 (03) :229-237
[5]
QUERY OPTIMIZATION IN DATABASE-SYSTEMS [J].
JARKE, M ;
KOCH, J .
COMPUTING SURVEYS, 1984, 16 (02) :111-152
[6]
QUERY-PROCESSING IN A SYSTEM FOR DISTRIBUTED DATABASES (SDD-1) [J].
BERNSTEIN, PA ;
GOODMAN, N ;
WONG, E ;
REEVE, CL ;
ROTHNIE, JB .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 1981, 6 (04) :602-625
[7]
Introduction to a system for distributed databases (SDD-1).[J].J. B. Rothnie;P. A. Bernstein;S. Fox;N. Goodman;M. Hammer;T. A. Landers;C. Reeve;D. W. Shipman;E. Wong.ACM Transactions on Database Systems (TODS).1980, 1
[8]
The correctness of concurrency control mechanisms in a system for distributed databases (SDD-1).[J].Philip A. Bernstein;David W. Shipman.ACM Transactions on Database Systems (TODS).1980, 1
[9]
分布式数据库系统及其应用.[M].邵佩英编著;.科学出版社.2005,
[10]
基于并行的SDD-1算法的改进 [J].
谢旭升 ;
陈复兴 .
山西大学学报(自然科学版), 2013, 36 (03) :338-343