Zookeeper中snapshot过程与session简介

QING____

浏览: 2262942 次
性别:
来自: 北京

最近访客更多访客>>

wusuosuo

sd_zf

lingxiajiudu

a123abc123abc

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Zookeeper

8. snapshot原理：

ZK Snapshot主要意义就是将当前Database + Memory中数据的状态,直接序列化到文件,以方便在故障时可以迅速恢复.snapshot是fuzzy的(非严格意义的snapshot)，snapshot所涉及到的类有SyncRequestProcessor(同步请求处理器，处理请求的log同步到disk)/ZKDatabase(ZK内存数据库)/TxnLog(事物日志)/SnapLog等。
Snapshot的流程比较简单，源码(SyncRequestProcessor)复述如下：

对于任何变更操作,首先添加到请求队列中,并记录txnLog,记录到txnLog的目的,就是防止物理机器崩溃但数据尚未持久化所带来的一致性问题,同时txnLog也是数据恢复/校验Database数据是否持久成功的标准.
从请求队列中，获取队列头部的请求操作(如果队列为空，将阻塞),将"请求"append进入txn log，logCount计数器+1；如果logCount计数器达到snapCount/2 + random(snapCount/2),将依次触发2个操作：首先关闭当前txn log，并新建一个tnx log来存储当前请求日志；然后对ZKDatabase进行snapshot（zookperServer.takeSnapshot()），snapshot是一个异步的过程，也是非常耗时的，ZK将开启一个新的独立线程来进行；此线程将会根据“snapshot.zid”的格式新建一个snapshot文件，并依次序列化sessionMap，ACL列表，DataTree。[即把Database中的数据全部序列化到snapshot文件中];之所以ZK 的snapshot是fuzzy的原因，它并没有遵循文件系统或类文件系统的snapshot规范，没有在snapshot过程中对zkDatabase或者说update请求进行阻塞，所以此snapshot文件中仍然会包含zid(此zid即为snapshot时Database中所持有的最大的zid)之后的数据变更，就像在给人拍照时，“人”并没有“暂停”活动，所以图片是“fuzzy”的。当然，这并不会对snapshot文件的恢复带来任何危害。这一切需要归咎与zk的数据库为内存数据库，而非文件数据库。
logCount置为0，“处理器链”将会继续传递，在FinalRequestProcessor将会把update请求变更位ZKDatabase数据。logCount是触发snapshot的开关,当变更操作的个数达到阀值,将会触发snapshot.
循环1）

注意：ZK是基于JVM，且为高内存消耗进程，所以对JVM的heap大小有一定的要求，如果heap过小，将会造成内存数据的多次swap，带来性能隐患。在高性能高可用cluster环境中，建议将ZK server部署在单独物理服务器上。

9. ZK Session：[Session原理详解]

    Zk客户端通过使用语言绑定（language binding）创建一个service的handle，来和zk service建立session。一旦创建，此handle初始为CONNECTING状态，然后client将会尝试与zk service中的一台server建立链接，链接成功后，状态将会被转换为CONNECTED。在一般情况下，session会是这两个状态中的一种。不过，当发生不可恢复时，例如session过期或者验证失败，或者应用明确的关闭了handle，那么此session的handle将会被变更为CLOSED状态。下图为session状态转换（来自apache zookeeper官网）
当client从zk service中获取一个handle（句柄）之后，zk将会为client创建一个session，sessionID为一个64位的数字。如果client链接到了其他的server上，它（client）将会把session id作为“握手”链接的一部分发送给server。因为安全的因素，server还为session id创建了一个password，以便任何ZK server都能够验证。当session创建成功后，session id和password都将会发送给client。无论client和哪个server建立链接，它都必须将session id和password一同发送给需要建立链接的server。
   当client连接失效后,它将会检索指定的server列表,并与其中一个server重新建立链接，session的状态被再次转换为CONNECTED（在session timeout有效期内），或者将会被转换成“EXPIRED”状态（session timeout之后，建立了链接）。不建议在链接失效后，创建新的session(Zookeeper实例)，ZK client将会为你处理重链接。此外，ZK内置的一些机制来处理类似“羊群效应”等等。当client被通知session过期，只需要创建一个新的session即可。
   A）’CONNECTED‘：session已经被创建，并且client正在和cluster通信。
   B）Client的信息将被Cluster所维持,并成为Cluster环境数据的一部分.
   C）’DISCONNECTED‘：client失去server的链接
   D）...一段时间后，即在“timeout”期间之后，cluster使session过期（移除session句柄），此时客户端并不能获取任何信息和通知，因为它仍没有和cluster server建立链接
   E）...一段时候后，client再此和server建立了链接,连接时将会把session id一并发送给server.
   F）'EXPIRED':如果session过期,client此时获取一个“过期”的通知。（session 过期后，ZK句柄的所有数据需要重建，及需要重新实例化zookeeper）

    Client与Server持续通讯时,也意味着Session是"活跃"的(sessionId将会伴随每次请求交付给server)，如果session空闲一段时间，这将会导致过期，所以client会发送一种PING类型的请求来保持session的alive，PING请求不仅可以让server知道client仍然存活，而且它也能够验证当前zk server是否alive。

   关于SessionMovedException:这是个内部异常，客户端将不会看到它。发生的原因是，一个请求的发送给server，但是因为网络的原因，此请求packet被延迟了，所以client链接超时后重新链接了其他的server，不过被延迟的packet最终到达了server，不过此旧server检测到此session已经被“moved”(即client所对应的session的"维护者"变成了其他server)，就关闭了链接。所以客户端是无法获得此异常，因为旧链接已经被关闭而无法读取数据。。
（源码所涉及到的类: Zookeeper(单机模式下)/LeaderZookeeperServer(分布式模式下),SendThread,SessionTrackImpl.run）大概意思：zookeeperServer启动后(如果是分布式模式,将有LeaderZookeeper负责Session过期控制)，都会创建一个SessionTrackImpl，tracker就是跟踪session的，其中一个属性为sessionSets，它是一个map，保持了tick（过期时间）与session，此tick为下一次过期的时间点（计算很有意思，是（当前系统时间/配置文件中的tick + 1）* tick），此时间点为tick间隔的整数倍，并且会不断被延迟。sessionTrack本身就是个线程，此线程会不断轮询，删除那些在过期时间点上的session，删除后，并有leader向集群中其他Followers发送closeSession请求。。线程执行时会检测tick和当前时间的关系，如果大于当前时间，就wait，直到时间点，执行之后，从新计算tick。

查看图片附件

分享到：

Zookeeper-Wathes简介 | Zookeeper简介(二)

2013-04-14 15:08
浏览 4267
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

zookeeper操作与编程: ### ZooKeeper简介与操作 ZooKeeper的设计理念是通过一个简化的文件系统，提供一个类似于目录树结构的数据模型，其中每个节点称为znode。znode可以存储数据，且每个节点可以有子节点。ZooKeeper使用Java编写，并...

java 中 zookeeper简单使用: 在Java中使用ZooKeeper，首先需要理解ZooKeeper的核心概念和原理。ZooKeeper作为一个分布式协调服务，它提供了一种树状的数据模型，每个节点（ZNode）都有唯一的路径标识，可以存储少量数据和权限控制信息（ACL）。...

单点登录源码: Spring session | 分布式Session管理 | [http://projects.spring.io/spring-session/](http://projects.spring.io/spring-session/) MyBatis | ORM框架 | [http://www.mybatis.org/mybatis-3/zh/index.html]...

环境流体力学：河流流动模拟.zip: 光电材料仿真，电子仿真等；从入门到精通教程；含代码案例解析。

C#实现Stewart六自由度平台反解算法及其应用: 内容概要：本文详细介绍了如何使用C#实现Stewart六自由度平台的逆解算法。首先定义了平台的基本结构，包括上下平台的半径、安装角度以及舵机零位偏移等参数。接着，通过欧拉角转换为旋转矩阵的方式实现了姿态转换，并在此基础上计算各个支腿的长度。文中还特别强调了一些常见的陷阱，如角度单位一致性、安装方向匹配、零位校准和数值稳定性等问题。此外，提供了具体的测试用例用于验证算法的正确性和性能。适合人群：具有一定C#编程基础并对机械臂控制、飞行模拟器或手术机器人等领域感兴趣的开发者和技术人员。使用场景及目标：适用于需要精确控制六自由度平台的应用场合，如飞行模拟器、手术机器人等。主要目的是通过数学模型将平台的姿态转换为具体的操作指令，从而实现精准定位与操控。其他说明：文中不仅给出了完整的代码实现，还分享了许多实践经验，帮助读者更好地理解和应用该算法。同时提醒开发者在实际项目中需要注意的一些关键点，如行程限制检查、运动学奇异性检测等。

夸克网盘批量处理助手，同步更新保存分享链接文件，增量更新文件，批量重命名文件夹，文件名称关键词替换: 夸克网盘批量处理助手，同步更新保存分享链接文件，增量更新文件，批量重命名文件夹，文件名称关键词替换

XML.md: XML.md

MATLAB实现光纤光栅均匀与非均匀应变仿真及其在光学传感的应用: 内容概要：本文详细介绍了利用MATLAB进行光纤光栅的均匀应变和非均匀应变仿真的方法。文中提供了具体的代码实例，解释了如何通过调整光栅的基本参数如中心波长、光栅长度、有效折射率等，以及引入应变系数和应变分布函数，分别计算均匀应变和非均匀应变下光纤光栅的反射率，并展示了相应的反射率曲线图。此外，还讨论了这两种应变模式对光栅反射谱的不同影响，强调了非均匀应变可能导致的光谱畸变现象。适用人群：对光纤光栅仿真感兴趣的研究人员和技术爱好者，尤其是那些希望通过MATLAB进行光器件设计和测试的人群。使用场景及目标：①用于科研项目中光纤光栅特性的研究；②辅助工程师在实际工程项目中评估光纤光栅传感器的表现；③帮助学生理解光纤光栅的工作机制和应变对其性能的影响。其他说明：文章不仅提供了详细的代码实现步骤，还分享了一些调试技巧和注意事项，有助于读者更好地理解和应用所介绍的技术。

计算机网络基于b站的学习笔记: 计算机网络概念，计算机网络，互联网，互连网的区别；计算机网络的组成、功能；三种交换技术；计算机网络的性能指标；以及计算机网络的分类

基于Simulink的ABS仿真模型及其PID控制策略的应用与优化: 内容概要：本文详细介绍了如何使用Simulink搭建防抱死制动系统（ABS）的仿真模型，并应用PID控制策略进行仿真分析。首先，文章解释了ABS系统的重要性和工作原理，然后逐步讲解了如何在Simulink中构建车轮动力学模块、制动压力模块等关键组件。接下来，文章深入探讨了PID控制策略的具体实现方法，包括PID参数的选择和调整技巧。通过多次仿真实验，展示了不同PID参数对ABS系统性能的影响，并提出了优化方案，如变增益策略和积分分离策略。最后，文章分享了一些实用的经验和技巧，如处理低速时的数值稳定性、应对路面突变等情况。适合人群：对汽车工程、控制系统设计感兴趣的工程师和技术爱好者，尤其是那些希望深入了解ABS系统和PID控制策略的人群。使用场景及目标：适用于希望在虚拟环境中研究和优化ABS系统性能的研究人员和工程师。主要目标是提高ABS系统的制动性能和安全性，确保在各种工况下都能保持最佳的制动效果。其他说明：文中不仅提供了理论知识，还包括了大量的实际案例和代码片段，帮助读者更好地理解和应用所学内容。此外，作者还分享了许多实践经验，如如何处理仿真中的常见问题和优化策略。

独子棋demo.rar: 独子棋demo.rar

基于Maxwell-Simplorer的永磁同步电机SVPWM控制联合仿真研究: 内容概要：本文详细介绍了如何利用Maxwell和Simplorer进行矢量联合仿真，结合SVPWM（空间矢量脉宽调制）算法实现对永磁同步电机的精确控制。文章首先解释了SVPWM的基本原理及其Python实现，接着阐述了在Maxwell中建立电机模型并设置参数的具体步骤，以及在Simplorer中搭建控制系统的方法。文中还讨论了仿真过程中如何调整控制器参数以优化系统性能，并展示了如何通过分析仿真结果来评估控制效果。此外，文章探讨了将该方法应用于其他类型电机的可能性，如感应电机和开关磁阻电机。适合人群：从事电机控制领域的研究人员和技术人员，尤其是对永磁同步电机和SVPWM算法感兴趣的读者。使用场景及目标：适用于需要深入了解永磁同步电机控制原理的研究人员，帮助他们掌握Maxwell和Simplorer联合仿真的具体操作流程，提高对电机控制系统的理解和优化能力。其他说明：文章不仅提供了详细的理论讲解，还附有大量代码片段和实践经验，有助于读者更好地理解和应用相关技术。同时，文章强调了实践中可能遇到的问题及解决方法，使读者能够在实际工作中避免常见错误。

【太阳能电池片图像处理】基于边缘检测与频域滤波的预处理系统设计：图像倾斜校正及栅格去除(论文复现或解答，含详细代码及解释）: 内容概要：本文详细介绍了太阳能电池片在线颜色分选系统的图像预处理方法。针对采集的原始图像中存在的传送带背景和随机倾斜等问题，提出了完整的预处理流程。主要包括：倾斜校正（通过边缘检测和霍夫变换）、去除栅格干扰（频域滤波和形态学操作），以及对多种边缘检测算子（如Roberts、Sobel、Prewitt、Canny和LOG）的比较与分析。此外，还探讨了不同直线检测方法（如Radon变换、Hough变换及其改进版本）的应用，并优化了整个预处理流程，确保后续的颜色特征提取和分类准确性。适用人群：从事计算机视觉、图像处理领域的研究人员和技术人员，特别是专注于工业自动化检测设备开发的工程师。使用场景及目标：①实现太阳能电池片图像的倾斜校正，确保图像水平放置；②有效去除电池片表面栅线对颜色分析的影响；③为后续的颜色特征提取和分类提供高质量的输入数据；④比较不同边缘检测算子的效果，选择最适合特定任务的算子；⑤评估各种直线检测方法的性能，选择最优方案应用于实际生产环境中。其他说明：文中不仅提供了详细的理论解释，还给出了具体的Python代码实现，帮助读者更好地理解和实践相关技术。同时，针对实际应用中的常见问题，如参数调优、光照一致性和异常处理等方面也给出了相应的建议。最后，通过一系列实验验证了所提方法的有效性，并提出了一些性能优化的方向。

Comsol锂离子电池仿真：电化学-热耦合模型与多物理场分析助力电池热管理: 内容概要：本文详细介绍了利用Comsol进行锂离子电池仿真的技术和应用，特别是在电化学-热耦合模型和多物理场分析方面。文章首先阐述了电化学-热耦合模型在充放电循环中的应用，通过MATLAB伪代码展示了如何定义电池几何形状、材料属性、边界条件以及耦合电化学和热传递过程。接下来讨论了液冷仿真与电池热管理模型，通过Python伪代码解释了液冷通道的构建、流体属性的设置及其流动与热传递的求解。此外，文章还比较了锂电池产热模型下风冷和液冷的不同效果，并强调了产热计算的重要性。最后，文章分享了一些实用的经验和技术细节，如处理高倍率充电时的浓度极化、选择合适的湍流模型、刀片电池的建模技巧等。适合人群：从事锂离子电池研究和开发的科研人员、工程师及相关领域的学生。使用场景及目标：①理解和优化锂离子电池的热管理机制；②评估不同冷却方式（如风冷、液冷）的效果；③提高电池系统的性能和安全性。其他说明：文中不仅提供了详细的理论背景和技术实现步骤，还分享了许多实践经验，有助于读者更好地掌握Comsol在锂离子电池仿真中的应用。

智能驾驶领域AEB系统的安全距离与TTC切换优化算法及其应用场景: 内容概要：本文探讨了自动紧急制动系统（AEB）中安全距离与时间头时距（TTC）的优化方法。首先介绍了AEB系统的基本原理，包括安全距离和TTC的定义及计算方式。接着提出了基于机器学习的动态调整机制，通过分析历史驾驶数据，训练回归模型预测最优安全距离，并设计了基于规则的智能切换机制，根据车速选择合适的评估标准。此外，通过仿真测试验证了改进算法的有效性，展示了其在低速跟车、高速变道等场景中的优越表现。最后，讨论了联合仿真中的挑战，如多物理场耦合与时序同步问题，并提供了相应的解决方案。适合人群：从事智能驾驶技术研发的专业人士，尤其是对AEB系统有研究兴趣的工程师和技术爱好者。使用场景及目标：适用于希望深入了解AEB系统工作原理及优化方法的研发团队。目标是通过改进现有算法，提高AEB系统在各种驾驶场景下的鲁棒性和安全性。其他说明：文中提到的技术细节和代码片段有助于读者更好地理解和实现相关算法。同时指出了现有研究存在的局限性，为进一步探索提供了方向。

数据结构.md: 数据结构.md

格式化输出.md: 格式化输出.md

三相不平衡电网下模块化多电平变流器(MMC)的先进控制策略及其实现: 内容概要：本文详细探讨了在三相不平衡电网条件下，模块化多电平变流器(MMC)的多种控制策略及其具体实现方法。主要内容包括：利用双二阶广义积分器(DSOGI)进行正负序分离控制，通过PI控制器实现零负环流抑制，以及采用谐振控制器抑制二倍频功率波动。此外，文中还介绍了不同控制模式之间的动态切换逻辑，确保系统在各种工况下的稳定性和高效性。文章提供了详细的MATLAB、Python和Verilog代码片段，展示了各个控制环节的具体实现。适合人群：从事电力电子、电力系统自动化领域的研究人员和技术人员，尤其是对MMC控制策略感兴趣的工程师。使用场景及目标：适用于需要解决三相不平衡电网问题的研究项目和工业应用场景。主要目标是在电压跌落等恶劣工况下，确保MMC系统的稳定性和平滑运行，提高系统的鲁棒性和效率。其他说明：文中引用了多篇相关领域的权威文献，为读者提供了进一步深入研究的方向。同时，作者强调了理论仿真与实际调试之间的差距，提醒读者在实验过程中需要注意的安全事项。

Python编程与PyQt GUI应用开发: 本书是关于Python编程语言和使用PyQt框架开发图形用户界面（GUI）应用的全面指南。首先介绍了Python的基础知识，包括安装、与Python交互、编写第一个程序、数据类型、基本元素、注释、续行和打印等。随后，深入探讨了Python的算术运算、位运算、复数、决策、逻辑运算符、循环等核心概念。接着，书中详细讲解了序列（包括字符串、列表、元组和集合）、函数和模块、类（包括类声明、方法、继承、垃圾回收、运算符重载和描述符）、文件处理以及异常处理。最后，作者重点介绍了PyQt框架，包括安装、窗口和对话框的创建、使用代码和Qt Designer创建GUI应用程序、基础控件、事件处理、高级控件（如LCD时钟、日历、组合框、表格、Web页面和图形显示）、菜单和工具栏的使用。本书适合希望学习Python编程和GUI开发的读者。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论