集群或者群集是指所有的设备共同完成相同的功能,每一个设备的功能都是完整的,但是在外界看来是一个设备。
分布式是所有的设备集结后,共同组成一个体系,相互之间协同工作,同时又各自完成自己的相应的工作,但是所有的功能不是在一个设备上,而是由不同的设备完成,但是由一个设备作为统一的接入点和协调点。
简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率。
例如:如果一个任务由10个子任务组成,每个子任务单独执行需1小时,则在一台服务器上执行改任务需10小时。
采用分布式方案,提供10台服务器,每台服务器只负责处理一个子任务,不考虑子任务间的依赖关系,执行完这个任务只需一个小时。
而采用集群方案,同样提供10台服务器,每台服务器都能独立处理这个任务。假设有10个任务同时到达,10个服务器将同时工作,10小后,10个任务同时完成,这样,整身来看,还是1小时内完成一个任务!
分布式是指将不同的业务分布在不同的地方。而集群指的是将几台服务器集中在一起,实现同一业务。分布式中的每一个节点,都可以做集群。而集群并不一定就是分布式的。
举例:就比如新浪网,访问的人多了,他可以做一个群集,前面放一个响应服务器,后面几台服务器完成同一业务,如果有业务访问的时候,响应服务器看哪台服务器的负载不是很重,就将给哪一台去完成。
而分布式,从窄意上理解,也跟集群差不多, 但是它的组织比较松散,不像集群,有一个组织性,一台服务器垮了,其它的服务器可以顶上来。
分布式的每一个节点,都完成不同的业务,一个节点垮了,哪这个业务就不可访问了。
分布式数据库系统:
分布式数据库系统是由若干个站集合而成。这些站又称为节点,它们在通讯网络中联接在一起,每个节点都是一个独立的数据库系统,它们都拥有各自的数据库、中 央处理机、终端,以及各自的局部数据库管理系统。因此分布式数据库系统可以看作是一系列集中式数据库系统的联合。它们在逻辑上属于同一系统,但在物理结构 上是分布式的。
分布式数据库系统已经成为信息处理学科的重要领域,正在迅速发展之中,原因基于以下几点:
1、它可以解决组织机构分散而数据需要相互联系的问题。比如银行系统,总行与各分行处于不同的城市或城市中的各个地区,在业务上它们需要处理各自的数据,也需要彼此之间的交换和处理,这就需要分布式的系统。
2、如果一个组织机构需要增加新的相对自主的组织单位来扩充机构,则分布式数据库系统可以在对当前机构影响最小的情况下进行扩充。
3、均衡负载的需要。数据的分解采用使局部应用达到最大,这使得各处理机之间的相互干扰降到最低。负载在各处理机之间分担,可以避免临界瓶颈。
4、当现有机构中已存在几个数据库系统,而且实现全局应用的必要性增加时,就可以由这些数据库自下而上构成分布式数据库系统。
5、相等规模的分布式数据库系统在出现故障的几率上不会比集中式数据库系统低,但由于其故障的影响仅限于局部数据应用,因此就整个系统来讲它的可靠性是比较高的。
特点
1、在分布式数据库系统里不强调集中控制概念,它具有一个以全局数据库管理员为基础的分层控制结构,但是每个局部数据库管理员都具有高度的自主权。
2、在分布式数据库系统中数据独立性概念也同样重要,然而增加了一个新的概念,就是分布式透明性。所谓分布式透明性就是在编写程序时好象数据没有被分布一样,因此把数据进行转移不会影响程序的正确性。但程序的执行速度会有所降低。
3、集中式数据库系统不同,数据冗余在分布式系统中被看作是所需要的特性,其原因在于:首先,如果在需要的节点复制数据,则可以提高局部的应用性。其次, 当某节点发生故障时,可以操作其它节点上的复制数据,因此这可以增加系统的有效性。当然,在分布式系统中对最佳冗余度的评价是很复杂的。
分布式系统的类型,大致可以归为三类:
1、分布式数据,但只有一个总? 据库,没有局部数据库。
2、分层式处理,每一层都有自己的数据库。
3、充分分散的分布式网络,没有中央控制部分,各节点之间的联接方式又可以有多种,如松散的联接,紧密的联接,动态的联接,广播通知式联接等。
http://storage.it168.com/a2011/0503/1185/000001185843.shtml
http://huangchp0599.blog.163.com/blog/static/7614880220091410642315/
相关推荐
7. 分布式系统的高可用性和可伸缩性:通过使用分布式文件系统(DFS)和数据库服务器(包括主从模式的数据库集群),分布式系统可以实现高可用性和可伸缩性。这意味着系统能够处理更多的用户请求,并且能够在不同节点...
分布式系统与并行计算是现代信息技术领域的核心研究方向,它们在处理大数据、提高计算效率以及实现高可用性方面发挥着重要作用。本文将对这两个主题进行深入探讨,特别关注Hadoop集群和MPI(Message Passing ...
总结而言,Java分布式开发与集群技术是一套完整的解决方案,从并发编程到网络通信,从对象序列化到集群高可用性设计,Java提供了一系列的工具和框架来支持分布式系统的开发和部署。在具体实践中,开发者需要根据应用...
分布式系统原理与范型是计算机科学中的一个重要领域,它涵盖了多台计算机如何通过网络协同工作,以实现一个共同的目标。《分布式系统原理与范型(第二版)》这本书深入浅出地介绍了这一主题,旨在帮助读者理解分布式...
分布式系统原理与范型是计算机科学领域的一个重要研究方向,它涉及如何构建和管理由多个独立计算机组成的系统,这些系统能够协调工作,对外表现得就像单一的、协调一致的系统一样。在分布式系统中,透明性、开放性、...
分布式与云计算Hadoop集群搭建是一个关于搭建Hadoop集群并实现map-reduce的实验PPT,附有详细的方法和步骤
分布式系统架构设计的主要目的是为了提高系统的高吞吐、高并发和高可靠性能。为了实现这一目标,系统架构设计者需要考虑到系统的可扩展性、可靠性和高性能等方面。 在分布式系统架构设计中,需要考虑到前端和后端的...
综上所述,大型电商分布式系统的实践涉及到了服务路由、服务负载均衡、服务配置中心的设计与实现,以及高效可靠的协调系统等关键技术点。在实际的系统设计和运营过程中,必须综合考虑系统的可伸缩性、可靠性、容错...
Ceph分布式系统的ISCSI高可用集群 Ceph分布式系统是当前流行的分布式存储解决方案之一,它可以提供高可用性、可扩展性和高性能的存储服务。然而,在分布式存储集群环境中,为了兼容现有存储协议,提高集群可扩展性...
文件是网盘链接地址,2018.7.4上传,链接一直可用 本套视频为dubbo分布式系统架构实战教学视频
《大规模分布式系统架构与设计实战》写到,分布式并行计算的基本原理解剖;分布式协调的实现,包括如何实现公共配置管理,如何实现分布式锁,如何实现集群管理等;分布式缓存的实现,包括如何提供完整的分布式缓存来...
对外子网负责处理与外网之间的交互数据,而对内子网负责传输分布式文件系统集群的管理数据。每个数据节点同时与两个子网相连,名称节点本身只与对内子网连接。此外,对外子网与外网之间使用防火墙加强安全性,并利用...
1. **分布式系统定义与特性**:分布式系统是由多台计算机和硬件设备组成,它们通过网络互相连接并共享资源,协同工作。其主要特性包括透明性、可靠性、可扩展性和性能优化。 2. **一致性模型**:在分布式环境中,...
分布式系统原理与范型是计算机科学中的一个重要领域,它涉及到多台计算机协同工作,共同处理一个任务或数据,以提供高可用性、可扩展性和性能优化。这些课件旨在为学习者提供一个全面且系统的分布式系统知识框架。...
Ceph分布式文件系统集群搭建实验报告完整版,具有详细的简介、步骤、截图,以及结果分析和错误分析哦哦哦!!!!!!!
分布式系统工程实践涉及到的关键技术与知识点包括但不限于以下几个方面: 硬件基础: 分布式系统的硬件基础包括服务器、存储设备、网络设备等硬件资源。工程师需要了解硬件的价格以及性能参数,比如CPU缓存的延迟...
根据不同的应用场景和特性,分布式系统可以分为分布式操作系统、网络操作系统、基于中间件的系统、分布式计算系统(如集群计算和网格计算)、分布式信息系统和分布式普适系统。 分布式系统的架构风格多样,如分层...