`
kavy
  • 浏览: 888374 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

zookeeper的数据存储和同步

 
阅读更多

一,zookeeper中的文件存储及相关配置

zookeeper启动后,会将所有数据加载到内存中,但是也会在硬盘上留下数据文件和日志文件便于恢复。在配置文件中,有如下的一些参数与文件相关:

  1. dataDir:保存内存快照数据的目录;
  2. dataLogDir:保存 transaction log的目录;
  3. globalOutstandingLimit :单台服务器上未完成的最大客户端请求数(当客户端发送请求太快而集群来不及处理时),默认1000.
  4. preAllocSize:transaction log预设的文件大小,默认是64M,
  5. snapCount:进行快照的阀值,默认10000;当transaction log条数达到 snapCount/2 + rand.nextInt(snapCount/2)时就做一次快照,使用随机数的原因是避免所有服务器会同时做快照

zookeeper的快照数据保存在$dataDir中,文件的命名格式为:snapshot.{16进制串},其中16进制串是lastZxid转换后的值。相关序列化和反序列化的类可以看{org.apache.zookeeper.server.persistence.FileSnap},快照文件中的内容包括文件头信息,DataTree数据及一些session数据。

事物日志则保存在$dataLogDir中,日志文件的命名格式类似与snapshot:log.{16进制串},相关读写的类可以见{org.apache.zookeeper.server.persistence.FileTxnLog}。日志文件中的数据格式稍微复杂一点,如代码注释中所述:

  1. The format of a Transactional log is as follows:
  2. *
  3. <blockquote>
  4. <pre> * LogFile:
  5. *     FileHeader TxnList ZeroPad
  6. *
  7. FileHeader{
  8. *     magic 4bytes (ZKLG)
  9. *     version 4bytes
  10. *     dbid 8bytes
  11. *   }
  12. *
  13. TxnList:
  14. *     Txn || Txn TxnList
  15. *
  16. Txn:
  17. *     checksum Txnlen TxnHeader Record 0x42
  18. *
  19. checksum8bytes Adler32 is currently used
  20. *   calculated across payload -- TxnlenTxnHeaderRecord and 0x42
  21. *
  22. Txnlen:
  23. *     len 4bytes
  24. *
  25. TxnHeader{
  26. *     sessionid 8bytes
  27. *     cxid 4bytes
  28. *     zxid 8bytes
  29. *     time 8bytes
  30. *     type 4bytes
  31. *   }
  32. *
  33. Record:
  34. *     See Jute definition file for details on the various record types
  35. *
  36. ZeroPad:
  37. *     0 padded to EOF (filled during preallocation stage)

如果需要分析日志文件的话,可以考虑对FileTxnLog和FileTxnIterator做简单修改来暴露数据读取接口。
二,zookeeper的数据恢复过程

当进行一次快照时,就会重新生成一个新的日志文件,二者结合可以把数据恢复(断点+动作重放),启动时数据恢复的具体的逻辑在{org.apache.zookeeper.server.persistence.FileTxnSnapLog}中:

  1. snapLog.deserialize(dtsessions);
  2. FileTxnLog txnLog = new FileTxnLog(dataDir);
  3. TxnIterator itr = txnLog.read(dt.lastProcessedZxid+1);
  4. long highestZxid = dt.lastProcessedZxid;

代码中先读取快照数据生成断点映像,然后根据断点映像中最大zxid开始进行事务重放

三,zookeeper节点间的数据同步

当各个节点已经自我恢复并选举出leader后,leader就开始和follows进行数据同步了,具体的逻辑可以见{org.apache.zookeeper.server.quorum.LearnerHandler}中:

leader构建NEWLEADER包,内含leader最大数据的zxid, 广播给follows,然后leader根据follower数量为每个follower创建一个LearnerHandler线程来处理同步请求:leader主线程阻塞,等待超过半数follower同步完数据之后成为正式leader。
follower接收到NEWLEADER包后响应FOLLOWERINFO给leader,告知本方数据最大的zxid值; leader接收到回馈后开始判断:

  1. 如果follower和leader数据一致,则直接发送DIFF告知已经同步;
  2. 判断这一阶段内有无已经北提交的决议值,如果有,那么
    a) 如果有部分数据没有同步,leader发送DIFF包将有差异的数据同步过去,同时将follower没有的数据逐个发送commit包给follower要求记录下来;
    b) 如果follower数据zxid更大,发送TRUNC包给follower要求删除多余数据
  3. 如果这一阶段没有提交的决议,直接发送SNAP包将快照同步给follower

以上消息完毕后,LEADER发送UPTODATE包告知follower当前数据已同步,等待follower的ACK完成同步过程。

本文出自 溪木镇的铁匠铺,转载时请注明出处及相应链接。

本文永久链接: http://www.zhouyoudao.com/zookeeper-data

分享到:
评论

相关推荐

    zookeeperMaster选举以及数据同步代码

    这个代码示例对于理解和学习Zookeeper的选举机制、数据同步,以及如何在实际项目中结合MySQL实现高可用的数据同步方案非常有帮助。通过深入研究和实践,我们可以更好地掌握分布式系统的设计和实现。

    zookeeper删除数据节点.rar_hello7gq_somethingjtt_spiderlxd_zk删除节点_zooke

    在Zookeeper中,数据存储是以节点(ZNode)的形式存在,每个节点都可以包含数据以及子节点。 标题"zookeeper删除数据节点.rar_hello7gq_somethingjtt_spiderlxd_zk删除节点_zooke"提及的关键点是关于Zookeeper中...

    zookeeper 服务监控和管理

    1.1 ZooKeeper数据模型:Zookeeper的数据模型是一种树形结构,类似于文件系统,由节点(ZNode)组成。每个ZNode都有一个唯一的路径标识,并可以存储数据。 1.2 角色与组件: - Leader:负责处理所有的写请求,以及...

    zookeeper节点数据的监听与读写操作

    Znode是Zookeeper中的数据存储单元,类似于文件系统中的文件或目录。每个Znode都有一个唯一的路径标识,并且可以包含数据和子节点。Znode分为临时节点和持久节点,临时节点在创建它的客户端断开连接后会自动删除,而...

    ZooKeeper3.4.9 windos和linux

    2.2 配置:修改conf/zoo.cfg,配置数据存储目录dataDir,以及服务器ID server.id。 2.3 启动:运行bin/zkServer.cmd启动ZooKeeper服务,通过bin/zkCli.cmd命令行工具进行交互。 三、Linux上的ZooKeeper部署 3.1 ...

    Zookeeper_安装和配置

    - `dataDir`:Zookeeper 保存数据的目录,用于存储服务器状态信息。 - `dataLogDir`(可选):日志目录,如果不设置则默认和 `dataDir` 相同。 - `clientPort`:客户端连接 Zookeeper 服务器的端口号。 4. **启动...

    Zookeeper-3.4.10和Zookeeper-3.5.7.zip

    Zookeeper提供了一种中心化的服务,用于命名、配置管理、分布式同步和组服务。这两个版本,Zookeeper-3.4.10和Zookeeper-3.5.7,代表了该系统的不同稳定性和功能增强阶段。 Zookeeper-3.4.10是3.4.x系列的一个稳定...

    Hbase与zookeeper笔记备份.rar

    1. 数据模型:Hbase采用行键(Row Key)、列族(Column Family)、列(Qualifier)、时间戳四元组来组织数据,这种模式适合稀疏、多维度的数据存储。 2. 数据分布:Hbase的数据分布在HDFS上,通过行键进行分区,...

    基于zookeeper动态扩展处理分类数据

    ZooKeeper的主要设计目标是简化分布式系统的复杂性,它通过提供一种共享的、有序的、版本化的数据存储来实现这一点。ZooKeeper节点(称为znode)可以存储小量的数据,并且支持读写操作,同时提供了观察机制,使得...

    zookeeper笔记.pdf

    ZooKeeper主要用于分布式应用程序的配置管理、名称服务、分布式同步和提供组服务等。 ZooKeeper命令 * 启动ZooKeeper命令:zkServer.sh start conf/zoo.cfg * 连接ZooKeeper命令:zkCli.sh -server localhost:...

    基于ZooKeeper的配置信息存储方案的设计与实现

    ZooKeeper设计的初衷是为分布式应用提供一种高可用性的配置管理服务,解决了分布式系统中数据存储、同步、命名和协调问题,特别适合于处理分布式环境中数据的一致性问题。 ZooKeeper的核心特点包括了简单、可依赖和...

    zookeeper-3.4.12版本

    三、Zookeeper数据模型 Zookeeper的数据模型类似于文件系统,由节点(ZNode)构成,每个节点都可以存储数据,并具有版本号、ACL(访问控制列表)和时间戳等属性。节点分为临时节点(会话结束自动删除)和持久节点...

    Zookeeper搭建和原理学习

    1. 分布式锁:Zookeeper 可以实现分布式锁,以确保分布式系统的同步和一致性。 2. 高效性:Zookeeper 的性能非常高效,可以支撑高并发和大规模的分布式系统。 3. 高可用性:Zookeeper 使用 Paxos 算法来确保分布式...

    基于Netty、ZooKeeper、Hdfs的高可用性的数据同步和保活.zip

    综上所述,这个项目结合了Netty的网络通信能力、ZooKeeper的分布式协调服务和Hdfs的分布式存储,构建了一个具备高可用性、数据同步和保活机制的系统。这种系统对于处理大规模、高并发的数据操作,尤其是在人工智能...

    zookeeper3.8和Dubbo安装包

    3. **配置**: 修改`conf/zoo.cfg`配置文件,设置数据存储目录(dataDir)和其他必要参数。 4. **启动**: 使用`bin/zkServer.sh start`命令启动Zookeeper服务,使用`bin/zkServer.sh status`检查状态。 5. **客户端...

    zookeeper连接工具zktools

    1. **配置管理**:Zookeeper可以存储和分发系统的配置信息,确保所有服务节点保持一致的配置状态,从而实现配置的集中管理和动态更新。 2. **命名服务**:通过Zookeeper,服务可以注册和发现其他服务,实现服务间的...

    zookeeper安装包和脑图.rar

    - **节点(Znode)**:Zookeeper的数据存储结构是树形的,每个节点称为Znode,类似于文件系统中的文件或目录。Znode可以存储数据,并且有唯一的路径标识。 - **会话(Session)**:客户端与Zookeeper服务器之间的...

    Zookeeper原理及应用

    Zookeeper是一个分布式服务框架,由Apache Hadoop子项目组成,它提供了可靠的协调系统,可以解决分布式环境中的数据管理问题,如统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。 Zookeeper结构...

    zookeeper 3.8.4

    - **节点(Znode)**:Zookeeper 的数据存储是以节点的形式进行的,每个节点都可以包含数据和子节点,类似于文件系统的目录结构。节点分为持久节点和临时节点,持久节点在创建后不会因为客户端会话结束而自动删除,...

Global site tag (gtag.js) - Google Analytics