zookeeper初探

yale

浏览: 362048 次
性别:
来自: 武汉

最近访客更多访客>>

ybjz

373044221

yuancihang

liuweipeng

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

开源

原理：

ZK是Apache Hadoop的一个子项目(分布式服务框架)，主要用来解决分布式集群中应用系统的一致性问题，它能提供基于类似于文件系统的目录节点树方式的数据存储，但是ZK并不是用来专门存储数据的，它的作用主要是用来维护和监控你存储的数据的状态变化（统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等）。通过监控这些数据状态的变化，从而可以达到基于数据的集群管理。

ZK应用场景

ZK从设计模式角度来看，是一个基于观察者模式设计的分布式服务管理框架，它负责存储和管理大家都关心的数据，然后接受观察者的注册，一旦这些数据的状态发生变化，ZK就将负责通知已经在ZK上注册的那些观察者做出相应的反应，从而实现集群中类似Master/Slave 管理模式.

统一命名服务（Name Service）:

分布式应用中，通常需要有一套完整的命名规则，既能够产生唯一的名称又便于人识别和记住，通常情况下用树形的名称结构是一个理想的选择，树形的名称结构是一个有层次的目录结构，既对人友好又不会重复。ZK的Name Service 与JNDI能够完成的功能是差不多的，它们都是将有层次的目录结构关联到一定资源上，但是ZK的Name Service更加是广泛意义上的关联，也许你并不需要将名称关联到特定资源上，你可能只需要一个不会重复名称，就像数据库中产生一个唯一的数字主键一样。NameService已经是ZK内置的功能，你只要调用ZK的API 就能实现。

配置管理（Configuration Management）:

配置的管理在分布式应用环境中很常见，例如同一个应用系统需要多台PC Server 运行，但是它们运行的应用系统的某些配置项是相同的，如果要修改这些相同的配置项，那么就必须同时修改每台运行这个应用系统的PC Server，这样非常麻烦而且容易出错。像这样的配置信息完全可以交给ZK来管理，将配置信息保存在ZK的某个目录节点中，然后将所有需要修改的应用机器监控配置信息的状态，一旦配置信息发生变化，每台应用机器就会收到ZK的通知，然后从ZK获取新的配置信息应用到系统中。

集群管理（Group Membership）:

ZK能够很容易的实现集群管理的功能，如有多台Server 组成一个服务集群，那么必须要一个“主机”知道当前集群中每台机器的服务状态，一旦有机器不能提供服务，集群中其它集群必须知道，从而做出调整重新分配服务策略。同样当增加集群的服务能力时，就会增加一台或多台Server，同样也必须让“主机”知道。

主机推举（Leader Election）:

ZK不仅能够帮你维护当前的集群中机器的服务状态，而且能够帮你选出一个“主机”，让这个主机来管理集群，这就是ZK的Leader Election。它们的实现方式都是在ZK上创建一个EPHEMERAL 类型的目录节点，然后每个Server 在它们创建目录节点的父目录节点上调用getChildren(String path, boolean watch) 方法并设置watch为true，由于是EPHEMERAL 目录节点，当创建它的Server 死去，这个目录节点也随之被删除，所以Children 将会变化，这时getChildren上的Watch 将会被调用，所以其它Server 就知道已经有某台Server死去了。新增Server 也是同样的原理。ZK如何实现Leader Election，也就是选出一个Master Server。和前面的一样每台Server 创建一个EPHEMERAL 目录节点，不同的是它还是一个SEQUENTIAL 目录节点，所以它是个EPHEMERAL_SEQUENTIAL目录节点。之所以它是EPHEMERAL_SEQUENTIAL 目录节点，是因为我们可以给每台Server 编号，我们可以选择当前是最小编号的Server 为Master，假如这个最小编号的Server 死去，由于是EPHEMERAL 节点，死去的Server 对应的节点也被删除，所以当前的节点列表中又出现一个最小编号的节点，我们就选择这个节点为当前Master。这样就实现了动态选择 Master，避免了传统意义上单Master容易出现单点故障的问题。

共享锁（Locks）:

共享锁在同一个进程中很容易实现，但是在跨进程或者在不同Server 之间就不好实现了。ZK却很容易实现这个功能，实现方式也是需要获得锁的Server 创建一个EPHEMERAL_SEQUENTIAL 目录节点，然后调用getChildren方法获取当前的目录节点列表中最小的目录节点是不是就是自己创建的目录节点，如果正是自己创建的，那么它就获得了这个锁，如果不是那么它就调用exists(String path, boolean watch) 方法并监控ZK上目录节点列表的变化，一直到自己创建的节点是列表中最小编号的目录节点，从而获得锁，释放锁很简单，只要删除前面它自己所创建的目录节点就行了。

队列管理:

ZK可以处理两种类型的队列：

1. 当一个队列的成员都聚齐时，这个队列才可用，否则一直等待所有成员到达，这种是同步队列。

2.队列按照FIFO 方式进行入队和出队操作，例如实现生产者和消费者模型。

同步队列用Zookeeper 实现的实现思路如下：

创建一个父目录/synchronizing，每个成员都监控标志（Set Watch）位目录/synchronizing/start是否存在，然后每个成员都加入这个队列，加入队列的方式就是创建/synchronizing/member_i的临时目录节点，然后每个成员获取/synchronizing目录的所有目录节点，也就是member_i。判断i 的值是否已经是成员的个数，如果小于成员个数等待/synchronizing/start 的出现，如果已经相等就创建/synchronizing/start。

ZK数据结构特点

1.每个子目录项NameService 都被称作为node，这个node是被它所在的路径唯一标识，如Server1 这个node的标识为/NameService/Server1

2.node可以有子节点目录，并且每个node 可以存储数据.

3.node是有版本的，每个node中存储的数据可以有多个版本，也就是一个访问路径中可以存储多份数据

4.node可以是临时节点，一旦创建这个node 的客户端与服务器失去联系，这个node 也将自动删除，ZK的客户端和服务器通信采用长连接方式，每个客户端和服务器通过心跳来保持连接，这个连接状态称为session，如果node是临时节点，这个session 失效，node也就删除了

5.node 的目录名可以自动编号，如App1已经存在，再创建的话，将会自动命名为App2

6.node 可以被监控，包括这个目录节点中存储的数据的修改，子节点目录的变化等，一旦变化可以通知设置监控的客户端，这个是ZK的核心特性,ZK的很多功能都是基于这个特性实现的

常用接口

客户端要连接ZK服务器可以通过创建org.apache.zookeeper.ZooKeeper的一个实例对象，然后调用这个类提供的接口来和服务器交互。前面说了ZK主要是用来维护和监控一个目录节点树中存储的数据的状态，所有我们能够操作ZK的也和操作目录节点树大体一样，如创建一个目录节点，给某个目录节点设置数据，获取某个目录节点的所有子目录节点，给某个目录节点设置权限和监控这个目录节点的状态变化。

/****
***创建一个目录节点路径，给它设置数据,其中createMode表示有四种类型的节点：
***PERSISTENT:持久化目录节点
***PERSISTENT_SEQUENTIAL:顺序自动编号的目录节点
***EPHEMERAL:临时目录节点，客户端和服务器端session超时，节点被删除
***EPHEMERAL_SEQUENTIAL:临时自动编号节点
**/
private String create(String path,byte[] data,List<ACL>acl,CreateMode createMode)

/****
***判断某个path是否存在，并设置是否监控这个目录节点，这个方法有一个重载方法，
***可以指定特定的watcher
**/
Stat exists(String path,boolean watch)

/****
***给某个目录节点设置特定的watcher，watcher在zk中是一个核心功能，watcher可以监***控目录节点的数据变化以及子目录变化，一旦这些状态发生变化，服务器就会通知所有***设置在这个目录节点上的watcher，从而每个客户端都很快知道它所关注的目录节点的***状态发生变化，而作出相应反应。
**/
Stat exists(String path,Watcher watch)

/****
***删除path对应的目录节点，version为-1可以匹配任何版本，也就删除了这个目录节点
***的所有数据
**/
void delete(String path,int version)

/****
***给path设置数据，可以指定这个数据的版本号，如果version为-1，则可以匹配任何版***本
**/
Stat setData (String path,byte[] data,int version)

/****
***获取这个path对应的目录节点存储的数据，数据的版本等信息可以通过stat 来指 定，***同时还可以设置是否监控这个目录节点数据的状态
**/
byte[] getData(Stringpath, boolean watch, Stat stat)

/****
***获取指定path下的所有子目录节点，同样getChildren方法也有一个重载方法可以设置***特定的wathcer监控子节点的状态
**/
List<String> getChildren (String path,boolean watch)

/****
***客户端将自己的授权信息提交给服务器，服务器将根据这个授权信息验证客户端的访问***权限。
**/
void addAuthInfo(Stringscheme, byte[] auth)

/****
***给某个目录节点重新设置访问权限，需要注意的是Zookeeper中的目录节点权限不具有 ***传递性，父目录节点的权限不能传递给子目
***录节点。目录节点ACL 由两部分组成：perms和id。Perms有ALL、READ、WRITE、***CREATE、DELETE、ADMIN 几种而id 标识了访问目录节点的身份列表，默
***认情况下有以下两种:ANYONE_ID_UNSAFE = new Id("reqeust", "anyone") 和***AUTH_IDS = new Id("auth", "") 分别表示任何人都可以访问和创建者拥有访问权限。
**/
Stat setACL(String path, List<ACL> acl, int version)
 
/****
***获取某个目录节点的访问权限列表。
**/
List<ACL> getACL(String path, Stat stat)

除了以上这些上表中列出的方法之外还有一些重载方法，如都提供了一个回调类的重载方法以及可以设置特定 Watcher 的重载方法，具体的方法可以参考org.apache.zookeeper. ZooKeeper 类的API 说明.

ZK安装以及配置

下载（http://mirror.bjtu.edu.cn/apache/zookeeper/）解压后，执行bin目录下的zkServer.sh start启动服务(先不慌着启动)，在执行启动脚本前，需要对ZK的配置文件进行配置（conf目录下），这个目录下有zoo_sample.cfg和log4j.properties，我们将zoo_sample.cfg改名为zoo.cfg，因zk在启动时找这个文件作为默认配置文件，常用配置内容：

tickTime:服务器和客户端之间心跳的间隔时间，将会以这个时间发送心跳包

dataDir:zk保存数据的目录，默认情况下zk将写数据的日志文件也保存在这个目录下。

clientPort:客户端连接zk服务器的端口，zk监听这个端口，接受客户端访问请求。

initLimit:zk初始化集群中其他从服连接到主服的心跳间隔数（tickTime的间隔时间算一次间隔数）

syncLimit:zk集群中主服与从服之间发送消息的时间的间隔数（tickTime的间隔时间算一次间隔数）

server.X=ip:port1:port2 x表示服务器号，ip和port1表示这个服务器与集群中主服交换信息的ip地址和端口，端口2表示当主服宕机后，该端口作为重新选举主服的端口。

Zk不仅在单机上运行，它主要是以集群的方式来提供服务，就像上述配置文件一样已经提供了相关配置，如果选择集群服务，还需要配置myid这个文件，这个文件中有一个数据就是x的值，zk启动会读取这个文件，与zoo.cfg配置比较来判断是那个服务器。

客户端小例子

package com.yale.zk.test;

import org.apache.zookeeper.CreateMode;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.ZooDefs.Ids;
import org.apache.zookeeper.ZooKeeper;
import org.junit.Test;

public class ZkTest {
	private static String CLIENT_PORT = "192.168.2.11:2181";
	private static int CONNECTION_TIMEOUT = 2000;
	
	@Test
	public void test() {
		try {
			//创建一个与服务器的连接
			 ZooKeeper zk = new ZooKeeper(CLIENT_PORT, CONNECTION_TIMEOUT, new Watcher() {
				 //监控所有被触发的事件
				  public void process(WatchedEvent event) {   
				      System.out.println("1"+"已经触发了" + event.getType() + "事件！");   
				  }
  
			 });
			 //创建一个目录节点
			zk.create("/testRootPath", "testRootData".getBytes(), 
			Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);  
			//创建一个子目录节点
			zk.create("/testRootPath/testChildPathOne", "testChildDataOne".getBytes(),  
			Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);  
			System.out.println("2"+new String(zk.getData("/testRootPath",false,null)));  
			//取出子目录节点列表
			System.out.println("3"+zk.getChildren("/testRootPath",true));  
			//修改子目录节点数据
			zk.setData("/testRootPath/testChildPathOne","modifyChildDataOne".getBytes(),-1);   
			System.out.println("4"+"目录节点状态["+zk.exists("/testRootPath",true)+"]");  
			//创建另外一个子目录节点
			zk.create("/testRootPath/testChildPathTwo", "testChildDataTwo".getBytes(),   
			Ids.OPEN_ACL_UNSAFE,CreateMode.PERSISTENT);  
			System.out.println("5"+new String(zk.getData("/testRootPath/testChildPathTwo",true,null)));  
//			//删除子目录节点
//			zk.delete("/testRootPath/testChildPathTwo",-1);  
//			zk.delete("/testRootPath/testChildPathOne",-1);  
//			//删除父目录节点
//			zk.delete("/testRootPath",-1);  
			//关闭连接
			zk.close();  
		} catch (Exception e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}   

	}

}

同时添加zookeeper、log4j的jar包，进行junit测试结果如下：

我们从上述可以看到，当节点目录以及目录数据发生变化的时候，就会触发回调函数中的内容，好了，等以后在深入研究后，在来这里写写。

分享到：

JPA中利用二级缓存优化访问性能 | Memcached的分布式算法

2010-09-27 12:22
浏览 1622
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论