`
天空之城
  • 浏览: 405517 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

分布式数据库

    博客分类:
  • Java
阅读更多

分布式数据库

  分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放在一个地方,每台计算机中都有DBMS的一份完整拷贝副本,并具有自己局部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一个完整的、全局的大型数据库。
  这种组织数据库的方法克服了物理中心数据库组织的弱点。首先,降低了数据传送代价,因为大多数的对数据库的访问操作都是针对局部数据库的,而不是对其他位置的数据库访问;其次,系统的可靠性提高了很多,因为当网络出现故障时,仍然允许对局部数据库的操作,而且一个位置的故障不影响其他位置的处理工作,只有当访问出现故障位置的数据时,在某种程度上才受影响;第三,便于系统的扩充,增加一个新的局部数据库,或在某个位置扩充一台适当的小型计算机,都很容易实现。然而有些功能要付出更高的代价。例如,为了调配在几个位置上的活动,事务管理的性能比在中心数据库时花费更高,而且甚至抵消许多其他的优点。
  分布式数据库系统主要特点:
  · 多数处理就地完成;
  · 各地的计算机由数据通信网络相联系。
  · 克服了中心数据库的弱点:降低了数据传输代价;
  · 提高了系统的可靠性,局部系统发生故障,其他部分还可继续工作;
  · 各个数据库的位置是透明的,方便系统的扩充;
  · 为了协调整个系统的事务活动,事务管理的性能花费高;
  数据分片
  类型:
  (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。
  (2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上作投影运算,每个投影称为垂直分片。
  (3)导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。
  (4)混合分片:以上三种方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。
  条件:
  (1)完备性条件:必须把全局关系的所有数据映射到片段中,决不允许有属于全局关系的数据却不属于它的任何一个片段。
  (2)可重构条件:必须保证能够由同一个全局关系的各个片段来重建该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用联接操作重构全局关系。
  (3)不相交条件:要求一个全局关系被分割后所得的各个数据片段互不重叠(对垂直分片的主键除外)。
  数据分配方式
  (1)集中式:所有数据片段都安排在同一个场地上。
  (2)分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻辑片段被指派在一个特定的场地上。
  (4)全复制式:数据在每个场地重复存储。也就是每个场地上都有一个完整的数据副本。
  (5)混合式:这是一种介乎于分割式和全复制式之间的分配方式。
  目前分布式数据库分配的设计,越来越多的采用寻找最优解的算法,比如遗传算法、退火机制等
  查询优化
  指在执行分布式查询时选择查询执行计划的方法和关系运算符的实现算法。根据系统环境的不同,查询优化所使用的算法也有所不同,通常分为远程广域网环境和高速局域网环境,其区别主要在网络的带宽。对于一元运算符可以采用集中式数据库中的查询优化方法。而对于二元运算符,由于涉及场地间的数据传输,因此必须考虑通信代价。分布式查询中常见的连接运算执行策略包括:
  (1)半连接方法:利用半连接运算的转换方法R∞S=(RµS)∞S。假设场地1和场地2上分别有关系R和关系S,首先在S上执行连接属性上的投影并将结果传输至场地1,在场地1上执行关系R与投影的连接操作,再将结果传输至场地2与关系S执行连接操作。这种方法能够降低执行连接运算时的网络通信代价,主要适用于带宽较低的远程广域网络。
  (2)枚举法方法:指枚举关系运算符的物理执行计划,通过对比执行计划的代价选择执行算法的方法。其中,连接运算符的物理执行计划包括嵌套循环方法、哈希连接法和归并连接法。枚举法主要适用于以磁盘IO代价为主的高速局域网环境。
分享到:
评论

相关推荐

    分布式数据库--30讲

    分布式数据库30讲 分布式数据库是指使用分布式架构实现的关系型数据库。它可以解决许多问题,如性能和可靠性问题。由于各种原因,大型机已经不再是多数企业的可选项,而采用 x86 架构的通用设备在单机性能和可靠性...

    分布式数据库课后习题答案整理

    "分布式数据库课后习题答案整理" 分布式数据库系统概述: 分布式数据库系统是一个物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式...

    东北大学分布式数据库课件和真题

    分布式数据库是计算机科学中的一个重要领域,它涉及到如何在多个计算机节点上存储和管理大量数据,以实现高可用性、可扩展性和性能优化。东北大学的这门课程显然旨在教授学生如何设计、实施和管理这样的系统。提供的...

    分布式数据库第三版所有课件及相关资料 徐俊刚版

    分布式数据库是现代互联网技术中的重要组成部分,它解决了单机数据库在处理海量数据和高并发访问时的局限性。徐俊刚版的“分布式数据库第三版”课件及相关资料提供了全面而深入的学习资源,帮助我们理解并掌握分布式...

    分布式数据库系统及其应用与答案

    分布式数据库系统是现代大型数据处理的关键技术之一,它在应对海量数据存储、高并发访问以及地理分布的数据需求方面发挥着重要作用。《分布式数据库系统及其应用(第二版)》由邵佩英编著,是中国科大出版社出版的...

    东北大学申德荣分布式数据库系统原理与应用讲义

    分布式数据库系统原理与应用 分布式数据库系统是一种将数据分布在多个地理位置独立的计算机节点上,通过网络进行通信和协调,使得用户能够透明地访问整个数据库系统的数据。这种系统设计旨在提高数据的可用性、容错...

    东北大学2009年春季博士入学试题-分布式数据库

    分布式数据库知识点总结 分布式数据库是指将数据库分布在多个物理位置的数据库系统,解决了传统集中式数据库的可扩展性、可靠性和性能瓶颈问题。下面是分布式数据库的一些重要知识点: 分片和分配模式 在分布式...

    分布式数据库架构及企业实践-基于Mycat中间件.pdf

    全书总计 8 章,首先简单介绍了分布式系统和分布式数据库的需求,然后讲解了分布式数据库的实现原理,并对市场上存在的各种分布式数据库中间件进行了对比,再围绕着如何利用 Mycat 实现分布式数据库而展开。《分布式...

    分布式数据库架构及企业实践-基于Mycat中间件

    全书总计 8 章,首先简单介绍了分布式系统和分布式数据库的需求,然后讲解了分布式数据库的实现原理,并对市场上存在的各种分布式数据库中间件进行了对比,再围绕着如何利用 Mycat 实现分布式数据库而展开。...

    分布式数据库习题.doc

    分布式数据库系统是一种高级的数据库架构,它将数据分布在多个地理位置分散的计算机节点上,通过网络进行协同工作。这种系统的设计旨在提升数据的可用性、可靠性和性能,同时保持数据的一致性和完整性。以下是对...

    分布式数据库 第三章 分布式数据库的设计

    分布式数据库设计 分布式数据库设计是指如何将分布式数据库系统中的数据进行逻辑划分和实际物理分配,以满足不同的业务需求和应用场景。在本章中,我们将讨论分布式数据库设计的基本概念、设计策略、分片定义、水平...

    分布式数据库架构及企业实践 基于Mycat中间件.pdf

    分布式数据库架构及企业实践,基于Mycat中间件的知识点主要涵盖了以下几个方面: 1. **分布式数据库基础**:分布式数据库是将数据分布在多个物理节点上,通过网络进行通信和协调,实现数据的一致性、可用性和扩展性...

    清华大学 分布式数据库课件

    分布式数据库是现代信息技术领域中的重要概念,尤其在大数据处理、云计算和互联网应用中扮演着核心角色。清华大学作为中国顶级的高等教育机构,在计算机科学和技术的教学方面有着深厚的底蕴。这份"清华大学分布式...

    中国数据库行业研究:分布式数据库技术系列简报-金融级需求与分布式数据库应用契合.pdf

    为了满足金融行业对数据处理的高要求,分布式数据库技术得到了快速发展和广泛的应用。分布式数据库系统是基于分布式计算环境的一种数据库系统,它将数据分散存储在不同的节点上,通过网络相互连接和通信。数据库中的...

    热璞数据库HotDB--《分布式数据库技术金融应用规范 安全技术要求》.pdf

    近年来,人民银行推动信息化...历经2年时间,于2020年11月26日,中国人民银行正式发布《分布式数据库技术金融应用规范 技术架构》(JR/T 0203-2020)、《分布式数据库技术金融应用规范安全技术要求》(JR/T0204-2020)

    分布式数据库系统概述

    ### 分布式数据库系统概述 #### 一、逻辑集中与物理分散 分布式数据库系统的核心特性在于其能够实现**逻辑集中与物理分散**。这意在让数据能够在不同的地理位置上存储,但逻辑上仍然视为一个整体。 - **物理分散*...

    分布式数据库技术系列简报:云计算场景驱动分布式数据库技术演进.pdf

    分布式数据库技术系列简报:云计算场景驱动分布式数据库技术演进 分布式数据库是现代云计算环境下处理大规模数据集的关键技术,它具备高可用性、良好的水平扩展能力和对大规模数据处理的能力。云计算场景对分布式...

    某服装集团分布式数据库设计

    【分布式数据库设计在某服装集团的应用】 分布式数据库在某服装集团的管理系统中扮演着至关重要的角色,它将数据分散存储于多个地理位置的计算机系统中,每个系统都包含DBMS的一个完整副本,通过网络互相连接,形成...

    东北大学 分布式数据库 第一章分布库概述

    东北大学分布式数据库第一章分布库概述 本章节主要介绍分布式数据库的概述,包括分布式数据库系统的基本概念、作用和特点、主要问题、系统结构、功能结构、模式结构、软件结构、分布式数据库系统分类等内容。 ...

    基于Mycat中间件分布式数据库架构及企业实践

    《基于Mycat中间件的分布式数据库架构及企业实践》 在现代企业级应用中,随着数据量的急剧增长,单机数据库系统已无法满足高并发、大数据量的处理需求,分布式数据库架构应运而生。Mycat作为一款开源的分布式数据库...

Global site tag (gtag.js) - Google Analytics