分布式数据库中数据分配方法的研究

被引:0
作者
杨艺
机构
[1] 重庆大学
关键词
分布式数据库; 片段分配; 统计信息; 代价公式; 启发式分配算法;
D O I
暂无
年度学位
2004
学位类型
硕士
导师
摘要
计算机网络的日益发展和普及以及跨地域分布的企业组织机构使得数据的存储和应用越来越分布化。分布式数据库(Distributed Database)技术就是在这种环境下应运而生的。基于这种技术的系统在可靠性、可用性和时间响应方面较传统的集中式数据库系统有更多的优越性,因此在实际中有着更广泛的应用。 分布式数据库系统中数据不是集中存放,而是根据实际应用的需要分布于网络的各个节点上,因此存在数据的划分问题,即数据的逻辑分割(分片)和片段的物理分配问题。在分布式数据库系统中需要冗余的数据,即增加数据副本以提高数据处理的本地性和效率,同时还可以增加系统的可靠性和可用性。分布式数据库设计的主要目标之一就是数据处理的本地性,即使数据尽可能存放在使用它们的应用所在的节点上,从而减少远程访问所需的通信代价。 怎样合理地分布数据,这是数据分配设计需要考虑的问题。数据分配问题对整个应用系统的改进、数据的可用性、提高DDB的效率和可靠性有很大影响,数据片段分配得好,整个系统的性能才会处于一个良好的状态。国内外专家和学者一直致力于基于分布式数据库的数据分配问题的研究,由于其复杂性,一直还没有找到一个兼顾代价和性能最优的通用数据分配方法。虽然大量的研究学者也提出了一些分配模型和算法,但是大多数模型和算法非常复杂难于理解,因而很难应用于实际环境。本论文主要基于文献中提出的得益-代价启发式分配方法[16],对其不合理之处进行改进,提出了一种启发式试消副本片段分配方法。 在该方法中,首先归纳出影响选择统计信息的几个主要因素,然后确定以事务处理通信代价为主的代价公式,最后,提出了“启发式试消副本分配算法”,该算法第一步通过只满足只读的本地性,确定一个最优初始分配;第二步考虑在初始化片段分配表基础上试消副本,以在只读事务和更新事务代价之间获得折中,消除副本的条件为只读事务和更新事务总代价是否减少,最终目的是获得一个对只读和更新总代价最小的分配方案。最后通过实验实现了算法,实验表明该方法能够在一定程度上减小解空间,并且简单、易行,获得的分配方案也更合乎实际。
引用
收藏
页数:68
共 14 条
[1]
EFFICIENT MANIPULATION OF A SET OF FRAGMENTS [J].
PAVLIDES, GS .
INFORMATION AND SOFTWARE TECHNOLOGY, 1995, 37 (04) :233-243
[2]
DATA ALLOCATION IN DISTRIBUTED DATABASE-SYSTEMS [J].
APERS, PMG .
ACM TRANSACTIONS ON DATABASE SYSTEMS, 1988, 13 (03) :263-304
[3]
DATABASE LOCATION IN COMPUTER-NETWORKS [J].
FISHER, ML ;
HOCHBAUM, DS .
JOURNAL OF THE ACM, 1980, 27 (04) :718-735
[4]
一种广域网中分布式数据库设计的数据分配方法 [J].
杨艺 ;
陈鹏 ;
李相枢 .
计算机应用, 2003, (12) :127-128+131
[5]
利用遗传算法解决分布式数据库系统中的数据分配问题 [J].
李忠文 .
山西大学学报(自然科学版), 2001, (02) :120-122
[6]
分布式数据库设计中的数据分配问题研究 [J].
师广利 ;
余冬梅 ;
袁占亭 .
甘肃工业大学学报, 1999, (04) :61-65
[7]
非确定处理调度图的启发式数据分配方法 [J].
古志民 ;
康继昌 .
小型微型计算机系统, 1999, (09) :713-716
[8]
分布式数据库系统及其应用前景 [J].
陈江萍 .
现代图书情报技术, 1996, (03) :29-31+36
[9]
分布式数据库技术的现状和发展方向 [J].
昌月楼 ;
杨利 .
计算机工程与科学, 1995, (03)
[10]
一种分布式数据分布的启发式算法 [J].
王于同 .
计算机时代, 1995, (04)