`
501311837
  • 浏览: 18435 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

ZooKeeper-- 管理分布式环境中的数据

阅读更多

1.随着分布式应用的不断深入,需要对集群管理逐步透明化。监控集群和作业状态;可以充分的利用ZK的独有特性,熟悉程度决定应用高度


2.Service端具有fast fail特性,非常健壮,无单点,不超过半数Server挂掉不会影响提供服务


3.zookeeper名字空间由节点znode构成,其组织方式类似于文件系统,其各个节点相当于目录和文件,通过路径作为唯一标示。与文件系统不同的是,每个节点具有与之对用的数据内容,同时也可以具有子节点


4.ZK用于存储协调数据,如状态、配置、位置信息等。每个节点存储的数据量很小KB级别

 

5.节点维护一个状态stat结构(包括数据变化的版本号、ACL变化、时间戳),以允许缓存验证与协调更新。每当节点数据内容改变,多一个版本号类似Hbase。客户端获取数据的同时也会获取数据版本号,节点的数据内容以原子方式读写。节点具有一个访问控制列表来约束访问操作,即具有权限控制

 

6.Watches:
Zk对Node的CRUD都可以触发监听
watch事件是一次性触发器,当wacht监视的数据发生变化,通知设置了该watch的clietn,即wacther

watch事件是异步发送至观察者

wacth是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟,所以有可能不能可靠的观察到节点的每一次变化

客户端监视一个节点,总是先获取watch事件再发现节点的数据变化

watch事件的顺序对应于ZK服务所见的数据更新的顺序

 

7.ZK在hadoop平台上的典型应用


storm集群:Zk作为nimbus(master)和supervisor(slave)的中间枢纽,保存strom集群和作业的所有信息。并负责nimbus和supervisor的全部通信
Hbase集群:Zk作为协调器,为hbase提供了稳定服务和failover机制,HRegionServer也会把自己以Ephemeral(临时节点)方式注入到ZK中,使得Hmaster可以随时感知到各个HRegionServer的健康状态(可用于监控RegionServer)此外Zk也避免了HMaster的单点问题

应用三大块:
strom应用开发,storm集群监控
MR应用开发
HBase应用开发

 

8.流行的场景应用:
分布式配置管理:
分布式订阅即所谓的配置管理,顾名思义就是将数据发布到ZK节点上,共订阅者动态的获取数据,实现配置信息的集中式管理和动态更新,例如全局的配置信息,地址列表等就非常适合使用

NameService
这个主要是作为分布式命名的服务,通过调用Zk的create node api,能够很容易的创建一个全局唯一的path,这个path就可以作为一个名称

分布式通知/协调
Zk中特有的watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知于协调,实现对数据变更的实时处理。
使用方法通常是不同系统都对ZK上同一个znode进行watch,监听znode的变化(包括znode本身内容及子节点)其中一个系统update了znode那么另一个系统能够收到通知,并作出相应处理

分布式锁
这个主要得益于ZK为我们保证了数据的强一致性,即用户只要相信每时每刻,ZK集群中任意节点上的相同znode的数据时一定相同的。锁服务可以分为两大类:1.保持独占 2.控制时序

Hbase Master选举是ZK经典使用场景


   Znode

Znode    Znode维护着数据、ACLaccess control list,访问控制列表)、时间戳等交换版本号等数据结构,它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加,这非常类似于数据库中计数器时间戳的操作方式。

另外Znode还具有原子性操作的特点:命名空间中,每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据,写操作将替换掉所有的数据。除此之外,每一个节点都有一个访问控制列表,这个访问控制列表规定了用户操作的权限。

    ZooKeeper中同样存在临时节点。这些节点与session同时存在,当session生命周期结束,这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用

 

     Watch机制

 

    Watch机制就和单词本身的意思一样,看。看什么?具体来讲就是某一个或者一些Znode的变化。官方给出的定义:一个Watch事件是一个一次性的触发器,当被设置了Watch的数据发生了改变的时候,则服务器将这个改变发送给设置了Watch的客户端,以便通知它们。

Watch机制主要有以下三个特点:

  1 一次性的触发器(one-time trigger

    当数据改变的时候,那么一个Watch事件会产生并且被发送到客户端中。但是客户端只会收到一次这样的通知,如果以后这个数据再次发生改变的时候,之前设置Watch的客户端将不会再次收到改变的通知,因为Watch机制规定了它是一个一次性的触发器。

  2 发送给客户端

    这个表明了Watch的通知事件是从服务器发送给客户端的,是异步的,这就表明不同的客户端收到的Watch的时间可能不同,但是ZooKeeper有保证:当一个客户端在看到Watch事件之前是不会看到结点数据的变化的。例如:A=3,此时在上面设置了一次Watch,如果A突然变成4了,那么客户端会先收到Watch事件的通知,然后才会看到A=4

  3被设置Watch的数据

    这表明了一个结点可以变换的不同方式。一个Znode变化方式有两种,结点本身数据的变化以及结点孩子的变化。因此Watch也可以设置为这个Znode的结点数据,当然也可以设置为Znode结点孩子。

 

     使用API来访问ZooKeeper

    API访问ZooKeeper才是客户端主要的使用手段,通过在客户端编写丰富多彩的程序,来达到对ZooKeeper的利用。这里给出一个简单的例子:(深入的还没能力给出啊,例子是从网上找的很清晰明了)

 

1. import java.io.IOException;
2.
3. import org.apache.zookeeper.CreateMode;
4. import org.apache.zookeeper.KeeperException;
5. import org.apache.zookeeper.Watcher;
6. import org.apache.zookeeper.ZooDefs.Ids;
7. import org.apache.zookeeper.ZooKeeper;
8.
9. public class demo {
10.     // 会话超时时间,设置为与系统默认时间一致
11.     private static final int SESSION_TIMEOUT=30000;
12.    
13.     // 创建 ZooKeeper 实例
14.     ZooKeeper zk;
15.    
16.     // 创建 Watcher 实例
17.     Watcher wh=new Watcher(){
18.            public void process(org.apache.zookeeper.WatchedEvent event)
19.            {
20.                    System.out.println(event.toString());
21.            }
22.     };
23.    
24.     // 初始化 ZooKeeper 实例
25.     private void createZKInstance() throws IOException
26.     {             
27.            zk=new ZooKeeper("localhost:2181",demo.SESSION_TIMEOUT,this.wh);
28.           
29.     }
30.    
31.     private void ZKOperations() throws IOException,InterruptedException,KeeperException
32.     {
33.            System.out.println("\n1. 创建 ZooKeeper 节点 (znode : zoo2, 数据: myData2 ,权限: OPEN_ACL_UNSAFE ,节点类型: Persistent");
34.            zk.create("/zoo2","myData2".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
35.           
36.            System.out.println("\n2. 查看是否创建成功: ");
37.            System.out.println(new String(zk.getData("/zoo2",false,null)));
38.                           
39.            System.out.println("\n3. 修改节点数据 ");
40.            zk.setData("/zoo2", "shenlan211314".getBytes(), -1);
41.           
42.            System.out.println("\n4. 查看是否修改成功: ");
43.            System.out.println(new String(zk.getData("/zoo2", false, null)));
44.                           
45.            System.out.println("\n5. 删除节点 ");
46.            zk.delete("/zoo2", -1);
47.           
48.            System.out.println("\n6. 查看节点是否被删除: ");
49.            System.out.println(" 节点状态: ["+zk.exists("/zoo2", false)+"]");
50.     }
51.    
52.     private void ZKClose() throws  InterruptedException
53.     {
54.            zk.close();
55.     }
56.    
57.     public static void main(String[] args) throws IOException,InterruptedException,KeeperException {
58.            demo dm=new demo();
59.            dm.createZKInstance( );
60.            dm.ZKOperations();
61.            dm.ZKClose();
62.     }
63.}

 

 

 

此类包含两个主要的 ZooKeeper 函数,分别为 createZKInstance ()和 ZKOperations ()。其中 createZKInstance ()函数负责对 ZooKeeper 实例 zk 进行初始化。 ZooKeeper 类有两个构造函数,我们这里使用  “ ZooKeeper  String connectString,  int sessionTimeout,  Watcher watcher 对其进行初始化。因此,我们需要提供初始化所需的,连接字符串信息,会话超时时间,以及一个 watcher 实例。 17 行到 23 行代码,是程序所构造的一个 watcher 实例,它能够输出所发生的事件。

 

    ZKOperations ()函数是我们所定义的对节点的一系列操作。它包括:创建 ZooKeeper 节点( 33 行到 34 行代码)、查看节点( 36 行到 37 行代码)、修改节点数据( 39 行到 40 行代码)、查看修改后节点数据( 42 行到 43 行代码)、删除节点( 45 行到 46 行代码)、查看节点是否存在( 48 行到 49 行代码)。另外,需要注意的是:在创建节点的时候,需要提供节点的名称、数据、权限以及节点类型。此外,使用 exists 函数时,如果节点不存在将返回一

 

 null 值。

 

分享到:
评论

相关推荐

    分布式服务框架 Zookeeper -- 管理分布式环境中的数据

    分布式服务框架Zookeeper是Apache Hadoop的一个子项目,专门用于管理分布式环境中的数据。它提供了一个高可用、高性能、分布式的命名服务、配置管理以及同步服务,是构建大规模分布式系统的基石。Zookeeper的设计...

    分布式服务框架 Zookeeper -- 管理分布式环境中的数据.pdf

    Apache ZooKeeper 是一个分布式服务框架,用于管理分布式环境中的数据,常被用作协调服务,例如在分布式计算、配置管理、命名服务等场景。它的设计目标是简单、高效且高可用,通过一致性协议保证数据的一致性。 在...

    分布式服务框架Zookeeper--管理分布式环境中的数据[收集].pdf

    ### 分布式服务框架Zookeeper--管理分布式环境中的数据 #### 一、Zookeeper简介 Zookeeper是一款开源的分布式协调服务框架,它主要用于解决分布式应用中常见的一致性问题,如命名服务、配置管理、集群管理和分布式...

    zookeeper-3.4.5-cdh5.16.2.tar.gz

    3. **集群同步**:通过选举算法实现主节点选举,确保在分布式环境中的一致性和高可用性。 4. **分布式锁**:提供分布式锁机制,确保在多线程环境下对共享资源的访问控制。 5. **队列管理**:实现先进先出(FIFO)...

    apache-zookeeper-3.5.6-bin.tar

    ZooKeeper 的设计目标是简化分布式环境中的复杂性,使开发者能够专注于构建分布式应用,而不是关注底层的分布式一致性问题。 在 `apache-zookeeper-3.5.6-bin.tar` 这个压缩包中,包含了 Apache ZooKeeper 3.5.6 ...

    apache-zookeeper-3.5.7-bin.tar.gz

    Apache ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它是集群的管理者,监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。最终将简单易用的接口和性能高效、功能稳定的系统提供给...

    zookeeper-3.4.6_zookeeper_

    1. **一致性模型**:Zookeeper采用ZAB(Zookeeper Atomic Broadcast)协议,确保在分布式环境中数据的一致性。这种强一致性模型使得多个节点上的数据保持同步,为分布式服务提供可靠的数据支持。 2. **原子操作**:...

    zookeeper-3.4.10.tar.gz

    《ZooKeeper 3.4.10在Linux环境下的安装与使用详解》 ZooKeeper,一个由Apache基金会开发的分布式协调服务,是大数据生态系统中的重要...通过熟练掌握ZooKeeper的使用,开发者能够更好地应对分布式环境中的诸多挑战。

    apache-zookeeper-3.5.9-bin.tar.gz

    - **分布式锁**: 实现分布式环境下的锁服务,确保操作的顺序性和一致性。 - **队列管理**: 实现先进先出(FIFO)的消息队列。 3. **Zookeeper架构** - **集群模式**: 由多个服务器节点组成,每个节点都存有数据...

    apache-zookeeper-3.8.4-bin.tar

    Zookeeper是Apache Hadoop项目的一部分,它在分布式环境中起到关键的角色,尤其是在大数据处理和分布式计算领域。 **Zookeeper的核心概念:** 1. **节点(Znode)**:Zookeeper中的数据存储单元,类似于文件系统的...

    linux中zookeeper安装包zookeeper-3.4.8.tar

    Zookeeper-3.4.8是其一个稳定版本,提供了一套可靠的服务来解决分布式环境中的诸多挑战。 首先,我们来看一下`zookeeper-3.4.8.tar`这个压缩包。在Linux系统上,`.tar`文件通常用来打包多个文件或目录,便于存储和...

    最新版linux apache-zookeeper-3.7.0-bin.tar.gz

    在Linux环境下,Zookeeper 的最新版本是3.7.0,这个版本提供了许多新特性和性能优化,使得它更适合大规模分布式环境的需求。 1. **Zookeeper的基本概念**: - **Znode**:Zookeeper中的数据单元,类似于文件系统的...

    apache-zookeeper-3.7.0

    - 它支持强一致性的读写操作,确保在分布式环境中,所有节点看到的数据是一致的。 - ZooKeeper 提供了诸如选举、会话、watch(监视器)等机制,帮助分布式系统实现一致性。 2. **服务发现**: - 在微服务架构中...

    zookeeper-3.6.3.zip

    在实际应用中,Zookeeper常被用于Hadoop、HBase、Kafka等分布式系统中,作为它们的协调器,确保分布式环境中的数据一致性、服务发现和管理。同时,Zookeeper的API易于使用,支持多种编程语言,如Java、Python、C等,...

    zookeeper-3.4.6.jar

    作为一款高效、可靠的分布式协调框架,Zookeeper在分布式环境中扮演着至关重要的角色,尤其在解决一致性问题上表现出色。 Zookeeper的核心功能在于提供命名服务、配置管理、集群同步、分分布式锁和领导者选举等一...

    apache-zookeeper-3.6.3-bin.zip

    Apache ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,它是集群的管理者,监视着分布式操作的进展,同时也提供了命名服务、配置管理、组服务、分布式同步和领导选举等功能。在Windows环境下安装...

    apache-zookeeper-3.6.3.zip

    - **配置管理**:集中化管理分布式应用的配置,避免在各个节点之间手动同步。 - **命名服务**:提供分布式应用的命名服务,便于定位分布式资源。 - **分布式同步**:实现分布式锁、分布式队列等功能,保证数据的一致...

    zookeeper-3.4.5-cdh5.15.1.tar.gz

    Zookeeper,作为Apache的一款开源分布式协调服务,是大数据生态系统中的重要组件,它为分布式应用提供高效且可靠的命名服务、配置管理、集群同步、分布式锁等功能。在本篇中,我们将深入探讨Zookeeper 3.4.5与CDH...

    apache-zookeeper-3.5.8-bin.tar.gz

    Zookeeper广泛应用于分布式环境中,如Hadoop、HBase、Kafka、Storm等,它提供了命名服务、配置管理、分布式锁、集群管理等多种功能,是构建高可用分布式系统的关键组件。通过理解并熟练掌握Zookeeper的使用,开发者...

Global site tag (gtag.js) - Google Analytics