hadoop的心跳回忆

yunsamzhang

浏览: 70116 次
性别:
来自: 杭州

最近访客更多访客>>

空空大师111

ph7.3

novoland

hanxiaobai

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2010-07 ( 9)
更多存档...

博客分类：

hadoop源码解读

Hadoop Oracle IE Apache JVM

hadoop的集群是基于master/slave模式，namenode和jobtracker属于master，而datanode/tasktracker属于slaves。master只有一个，而slaves有多个。

namenode与datanode之间的通信，jobtracker与tasktracker直接的通信，都是通过“心跳”完成的。

以前看过hadoop心跳原理的源代码，今天再回忆一下，呵呵，所以叫“心跳回忆”。

1、心跳机制

心跳的机制大概是这样的：
1) master启动的时候，会开一个ipc server在那里。
2) slave启动时，会连接master，并每隔3秒钟主动向master发送一个“心跳”，将自己的状态信息告诉master，然后master也是通过这个心跳的返回值，向slave节点传达指令。

2、找到心跳的代码

拿namenode和datanode来说，在datanode的offerService方法中，每隔3秒向namenode发送心跳的代码：

 /**
   * Main loop for the DataNode.  Runs until shutdown,
   * forever calling remote NameNode functions.
   */
  public void offerService() throws Exception {
     
    ...

    //
    // Now loop for a long time....
    //

    while (shouldRun) {
      try {
        long startTime = now();

        //
        // Every so often, send heartbeat or block-report
        //
        
	// 如果到了3秒钟，就向namenode发心跳
        if (startTime - lastHeartbeat > heartBeatInterval) {
          //
          // All heartbeat messages include following info:
          // -- Datanode name
          // -- data transfer port
          // -- Total capacity
          // -- Bytes remaining
          //
          lastHeartbeat = startTime;
          DatanodeCommand[] cmds = namenode.sendHeartbeat(dnRegistration,
                                                       data.getCapacity(),
                                                       data.getDfsUsed(),
                                                       data.getRemaining(),
                                                       xmitsInProgress.get(),
                                                       getXceiverCount());

	  // 注意上面这行代码，“发送心跳”竟然就是调用namenode的一个方法？？

          myMetrics.heartbeats.inc(now() - startTime);
          //LOG.info("Just sent heartbeat, with name " + localName);

	  // 处理对心跳的返回值（namenode传给datanode的指令）
          if (!processCommand(cmds))
            continue;
        }

  	// 这里省略很多代码
	...
    } // while (shouldRun)
  } // offerService

上面这段代码，如果是单机的程序，没什么值得奇怪的。但是，这是hadoop集群！datanode和namenode在2台不同的机器（或2个JVM）上运行！datanode机器竟然直接调用namenode的方法！这是怎么实现的？难道是传说中的RMI吗？？

下面我们主要就来分析这个方法调用的细节。

3、心跳的底层细节一：datanode怎么获得namenode对象的？

首先，DataNode类中，有一个namenode的成员变量：

public class DataNode extends Configured 
    implements InterDatanodeProtocol, ClientDatanodeProtocol, FSConstants, Runnable {
  ...
  public DatanodeProtocol namenode = null;
  ... 
}

下面是NameNode类的定义：

public class NameNode implements ClientProtocol, DatanodeProtocol,
                                 NamenodeProtocol, FSConstants,
                                 RefreshAuthorizationPolicyProtocol {
  ... 
}

注意：NameNode实现了DatanodeProtocol接口，DatanodeProtocol接口定义了namenode和datanode之间通信的方法。

那么，DataNode类是怎么获取到NameNode类的引用呢？

在Datanode端，为namenode变量赋值的代码：

    // connect to name node
    this.namenode = (DatanodeProtocol) 
      RPC.waitForProxy(DatanodeProtocol.class,
                       DatanodeProtocol.versionID,
                       nameNodeAddr, 
                       conf);

在继续去RPC类中追踪：

VersionedProtocol proxy =
        (VersionedProtocol) Proxy.newProxyInstance(
            protocol.getClassLoader(), new Class[] { protocol },
            new Invoker(addr, ticket, conf, factory));

现在，明白了！
1) 对namenode的赋值，并不是真正的new了一个实现了DatanodeProtocol接口的对象，而是获得了一个动态代理！！
2) 上面这段代码中，protocol的类型是DatanodeProtocol.class
3) 对namenode的所有调用，都被委托(delegate)给了Invoker

4、心跳的底层细节二：看看Invoker类

Invoker类是org.apache.hadoop.ipc.RPC类的一个静态内部类：

	 private static class Invoker implements InvocationHandler {

在这个类中，看invoke方法：

public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
			...

		      ObjectWritable value = (ObjectWritable)
		        client.call(new Invocation(method, args), address, 
		                    method.getDeclaringClass(), ticket);
      			...
		      return value.get();
		   }

所有的方法调用又被delegate给client的call方法了！

client是Invoker中的成员变量：

 private Client client;

所以可以看出：DatanodeProtocol中的每个方法调用，都被包装成一个Invocation对象，再由client.call()调用

5、心跳的底层细节三：Invocation类

Invocation类是org.apache.hadoop.ipc.RPC类的一个静态内部类

没有什么业务逻辑方法，主要作用就是一个VO

6、心跳的底层细节四：client类的call方法

接下来重点看client类的call方法：

  public Writable call(Writable param, InetSocketAddress addr, 
                       Class<?> protocol, UserGroupInformation ticket)  
                       throws InterruptedException, IOException {

    Call call = new Call(param);   
		// 将Invocation转化为Call
    Connection connection = getConnection(addr, protocol, ticket, call);
		// 连接远程服务器
    connection.sendParam(call);                 // send the parameter
		// 将“序列化”后的call发给过去
    boolean interrupted = false;
    synchronized (call) {
      while (!call.done) {
        try {
          call.wait();                           // wait for the result
		// 等待调用结果
        } catch (InterruptedException ie) {
          // save the fact that we were interrupted
          interrupted = true;
        }
      }

      if (interrupted) {
        // set the interrupt flag now that we are done waiting
        Thread.currentThread().interrupt();
      }

      if (call.error != null) {
        if (call.error instanceof RemoteException) {
          call.error.fillInStackTrace();
          throw call.error;
        } else { // local exception
          throw wrapException(addr, call.error);
        }
      } else {
        return call.value;
		// 返回
      }
    }
  }

7、现在，一目了然了

datanode向namenode发送heartbeat过程是这样的：

	a) 在datanode初始化获得namenode的proxy
	b) 在datanode上，调用namenode proxy的heartbeat方法：
		namenode.sendHeartbeat(dnRegistration,
                                                       data.getCapacity(),
                                                       data.getDfsUsed(),
                                                       data.getRemaining(),
                                                       xmitsInProgress.get(),
                                                       getXceiverCount());
	c) 在datanode上的namenode动态代理类将这个调用包装成(或者叫“序列化成”)一个Invocation对象，并调用client.call方法
	d) client call方法将Invocation转化为Call对象
	e) client 将call发送到真正的namenode服务器
	f) namenode接收后，转化成namenode端的Call，并process后，通过Responder发回来！
	g) datanode接收结果，并将结果转化为DatanodeCommand[]

8、再看动态代理

动态代理：让“只有接口，没事对应的实现类”成为可能，因为具体方法的实现可以委托给另一个类！！

在这个例子中，就datanode而言，DatanodeProtocol接口是没有实现类的！

*** THE END ***

分享到：

用hadoop估算圆周率PI(3.1415926)的值 | hadoop的1TB排序

2010-07-11 09:38
浏览 3440
评论(3)
论坛回复 / 浏览 (3 / 6170)
分类:企业架构
查看更多

3 楼 mygirl1987 2010-10-27

那datanode发送心跳也是走的50010端口吗？我不想让datanode发送心跳给namenode，就是杀死datanode某个节点，该禁掉它哪个端口呀？

2 楼 tedeyang 2010-07-12

写得很好。
接口模式的远程RPC基本都是如此实现的，譬如hessian。

1 楼 niumd 2010-07-12

楼主在做东西，采用hadoop；介绍hadoop的文章一直很少

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

2021电子科技大学分布式系统重点整理及20年回忆版试题: - 心跳检测、超时重试、故障检测算法等，确保系统能够快速识别并应对节点故障。 - 检错码（如CRC）、冗余备份、检查点和日志记录等技术用于错误恢复。 8. 并发控制与调度： - 分布式系统中的锁、令牌环、两阶段...

电子科技大学分布式系统2020年期末试卷回忆版: 7. **分布式服务框架**：如Hadoop、Spark、Flink等大数据处理框架，以及Dubbo、Spring Cloud等微服务框架。在"2020电子科技大学分布式系统牛正新李玉军考试题回忆版.pdf"中，可能会包含具体题目，如： - 分析一个...

apache-flume-1.6.0-bin: 5. **容错与可靠性**: Flume通过心跳检测和自动故障恢复机制确保数据传输的可靠性。如果某个agent失败，系统可以自动重新路由数据到其他可用的agent。 6. **扩展性**: 由于Flume的模块化设计，可以通过编写自定义...

AMESim仿真平台在电动汽车热泵空调系统设计与优化的应用解析: 内容概要：本文深入探讨了AMESim仿真平台在电动汽车(EV)热泵空调系统设计与优化中的应用。首先介绍了AMESim的基础建模方法，如构建制冷循环模型中的压缩机、蒸发器和冷凝器等组件，并详细解释了各部件的工作原理及其参数设定。接着重点阐述了EV热泵空调系统的特殊之处，即不仅能够制冷还可以在冬季提供高效的制热功能，这对于提高电动汽车在寒冷条件下的续航里程和乘坐舒适性非常重要。文中给出了几个具体的案例，包括通过改变压缩机运行频率来进行性能优化，以及针对低温环境下热泵系统的控制策略，如四通阀切换逻辑、电子膨胀阀开度调节等。此外，还讨论了热泵系统与其他子系统（如电池温控）之间的协同工作方式，强调了系统集成的重要性。最后分享了一些实用的经验技巧，例如如何避免仿真过程中可能出现的问题，怎样评估系统的整体性能等。适合人群：从事汽车工程、暖通空调(HVAC)领域的研究人员和技术人员，特别是关注新能源汽车热管理系统的专业人士。使用场景及目标：适用于希望深入了解电动汽车热泵空调系统特性的工程师们，旨在帮助他们掌握基于AMESim进行系统建模、仿真分析的方法论，以便更好地指导实际产品研发。阅读建议：由于涉及到较多的专业术语和技术细节，建议读者具备一定的机械工程背景知识，同时配合官方文档或其他参考资料一起研读，以加深理解。

dtcwt 双树复小波的matlab工具箱: dtcwt 双树复小波的matlab工具箱。内容来源于网络分享，如有侵权请联系我删除。

基于Hadoop的朴素贝叶斯分类(MapReduce实现).zip: 基于hadoop的系统

永磁同步电机中电流预测控制与广义预测控制（速度环）的技术解析及应用: 内容概要：本文探讨了永磁同步电机（PMSM）控制系统中两种先进的控制策略：电流预测控制和广义预测控制（GPC），特别是在速度环中结合扩展状态观测器（ESO）的应用。文章首先介绍了广义预测控制的基本原理及其在速度环中的实现方式，强调了其通过滚动优化对未来系统输出进行预测的能力。接着讨论了电流环中采用的双矢量改进预测控制算法，该算法通过优化两个电压矢量的选择提高了电流控制的精度和动态响应速度。此外，文章还提供了具体的代码示例和技术细节，帮助读者更好地理解和实现这些控制策略。最后，推荐了几篇相关文献供进一步学习。适合人群：从事电机控制领域的研究人员、工程师以及对预测控制感兴趣的高校师生。使用场景及目标：适用于需要提高永磁同步电机控制系统性能的研究项目或工业应用场景，旨在实现更精确、高效的电机控制，增强系统的鲁棒性和稳定性。其他说明：文中提到的方法已在实验室环境中进行了验证，并取得了显著的效果，如减小了突加负载时的速度跌落幅度，降低了电流谐波失真度等。同时，作者分享了一些实用的调试技巧和注意事项，有助于加速实际项目的开发进程。

期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）: 期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目），个人经导师指导并认可通过的高分设计项目，评审分99分，代码完整确保可以运行，小白也可以亲自搞定，主要针对计算机相关专业的正在做大作业的学生和需要项目实战练习的学习者，可作为毕业设计、课程设计、期末大作业，代码资料完整，下载可用。期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作业Python实现基于图神经网络的信任评估项目源代码+使用说明（高分项目）期末作

开源6轴机械臂控制器SmallRobotArm AR3：离线控制与运动学算法详解: 内容概要：本文详细介绍了开源6轴机械臂控制器SmallRobotArm AR3的功能特点和技术细节。首先，文章展示了AR3可以直接通过板载按钮进行关节和坐标运动控制，无需连接电脑，提供了便捷的操作体验。其次，深入探讨了其核心算法，包括正逆解算法、运动模式切换逻辑以及平滑处理机制。此外，还介绍了自动标定程序、G代码支持和扩展功能如手势控制等特性。最后，强调了AR3的高扩展性和易用性，使其成为机器人爱好者和专业开发者的理想选择。适合人群：对机器人技术和机械臂感兴趣的初学者、中级开发者及研究人员。使用场景及目标：适用于教育、科研、DIY项目等领域，旨在帮助用户快速掌握机械臂控制原理并应用于实际任务中。其他说明：文中提供的代码片段有助于理解和实现相关功能，而详细的硬件介绍则为动手能力强的用户提供改装灵感。

编程竞赛蓝桥杯Python模拟题集锦与解析：涵盖字符串处理、数字运算及算法设计: 内容概要：本文档提供了10道蓝桥杯Python模拟题及其详细解答过程，涵盖字符串处理、数字运算、算法设计等多个方面。题目包括数字反转、字母转换、数字分段和、质数判断、字符串统计、数独验证、最大子数组和、括号匹配、斐波那契数列和文件统计。每道题目不仅给出了详细的解题思路和分析，还附有完整的Python源代码。通过这些题目，读者可以系统地提升编程能力和算法思维，掌握常见的编程技巧和方法。适合人群：适合有一定编程基础的Python学习者，特别是准备参加蓝桥杯或其他编程竞赛的学生和爱好者。使用场景及目标：①作为蓝桥杯赛前训练资料，帮助参赛者熟悉比赛题型和解题思路；②作为编程练习题集，巩固Python语言的基础知识和常用算法；③通过实际编程练习，提高解决实际问题的能力和编程水平。阅读建议：建议读者先尝试独立完成每道题目，然后再参考提供的解题思路和代码，对比自己的解法，找出差距并加以改进。同时，注意理解每道题目背后的算法思想和编程技巧，以便举一反三，灵活应用。

web_6_login.rar: web_6_login.rar

AI插件实用脚本illustrator-scripts-master: 脚本插件 1.Ai转PS矢量图层 2.分割线段 3.图形变换 4.圆形填充 5.文字块排版 6.多页PDF文档置入将jsx文件复制到\Abobe Illustrator XX\Presets（在部分AI软件中可能显示为“预设”）\zh_CN\脚本文件夹下，重新启动ai，就可以在"文件"-"脚本"下看见ai脚本菜单，运行即可。

嵌入式系统中滑模观测器与PLL的C代码实现及其在STM32F1平台的应用: 内容概要：本文详细介绍了滑模观测器和PLL在STM32F1平台上的C代码实现。滑模观测器用于估计系统内部状态，尤其适用于电机控制领域；PLL则用于确保输出信号相位与输入信号相位保持一致。文中展示了两种滑模观测器的实现方法：一种采用符号函数进行硬切换，另一种采用饱和函数进行软化处理。此外，文章还强调了使用TI的IQmath库进行定点计算加速，以提高运算效率并减少资源占用。通过具体的代码示例和调试技巧，作者分享了如何在STM32F1平台上实现高效稳定的滑模观测器和PLL系统。适合人群：嵌入式系统开发者、电机控制系统工程师、熟悉C语言编程的技术人员。使用场景及目标：① 实现高效的滑模观测器和PLL系统，应用于电机控制和其他实时性要求较高的场景；② 学习如何使用IQmath库进行定点计算加速，优化嵌入式系统的性能；③ 掌握调试技巧，确保系统稳定运行。其他说明：文章提供了详细的代码示例和调试经验，帮助读者更好地理解和实现滑模观测器和PLL系统。同时，文中提到的一些注意事项和常见问题解决方案也非常实用。

基于纳什谈判与ADMM的共享储能电站优化运行解决方案: 内容概要：本文探讨了利用纳什谈判理论和交替方向乘子法（ADMM）解决共享储能电站中多用户之间的利益分配问题。文中详细介绍了将复杂的利益分配问题转化为数学模型的方法，以及如何通过ADMM算法实现分布式优化，确保各参与方都能接受的最优解。同时，文章还展示了实际应用案例，证明了该方法的有效性和优越性。适合人群：从事电力系统优化、储能技术研究的专业人士，以及对分布式优化算法感兴趣的科研人员。使用场景及目标：适用于多个用户共同使用储能设施的场景，旨在通过科学合理的算法设计，实现储能系统的高效运行和利益的最大化分配。其他说明：文章不仅提供了详细的算法实现步骤，还包括了一些实用的代码片段和实验结果分析，帮助读者更好地理解和应用相关技术。此外，文中提到的一些反直觉现象也为进一步的研究提供了思路。

08011车TC1车ER（A、B网）通讯故障分析报告 .docx: 08011车TC1车ER（A、B网）通讯故障分析报告 .docx

2025年机器人+人工智能工业应用研究报告.pdf: 2025年机器人+人工智能工业应用研究报告.pdf

智能优化领域的麻雀搜索算法(DEH_SSA)改进及其Python实现: 内容概要：本文深入探讨了麻雀搜索算法（SSA）的一种改进版本——融合差分进化和多策略的麻雀搜索算法（DEH_SSA）。文章首先介绍了反向学习初始化种群、非线性因子改进发现者策略、改进警觉性策略、融合差分算法以及精英扰动策略五大创新点。接着详细展示了这些策略的具体实现方法，如反向学习初始化通过计算反向解使初始种群分布更合理，非线性因子改进发现者策略通过动态调整搜索步长提高搜索效率等。此外，文中提供了23个基准测试函数的实验结果，证明了DEH_SSA相比传统SSA在收敛速度和最优解质量上的显著优势。最后给出了详细的调参指南，帮助初学者更好地理解和应用该算法。适合人群：对智能优化算法感兴趣的研究人员和技术开发者，尤其是有一定编程基础并对群体智能算法有初步了解的人士。使用场景及目标：适用于需要解决复杂优化问题的场景，如工程优化、机器学习超参数调优等领域。目标是提供一种高效的优化工具，帮助用户更快更精确地找到全局最优解。其他说明：文章不仅提供了理论解释，还有丰富的代码实例，便于读者动手实践。同时，附带的调参指南有助于读者根据具体问题调整算法参数，获得更好的优化效果。

西门子WinCC报表系统多版本通用模板及优化技术详解: 内容概要：本文详细介绍了西门子WinCC报表系统的多版本通用模板及其优化技术。涵盖了日报表、月报表、年报表、自由报表及班次报表等多种类型的报表模板，提供了详细的代码示例，包括VBS脚本、SQL查询语句、C脚本等。文中强调了性能优化措施，如索引建立、参数化查询、存储过程的应用等，并附有配套的视频教程帮助理解和实践。此外，还讨论了班次报表的灵活性设计、数据分页技术、错误处理机制等方面的内容。适合人群：已经具备WinCC脚本基础和SQL语言基础的技术人员，尤其是从事工业自动化领域的工程师。使用场景及目标：适用于需要频繁生成各类生产报表的企业，旨在提高数据查询效率，满足不同客户的定制化需求，同时确保系统的稳定性和兼容性。通过学习本文提供的模板和技术，用户能够更好地应对复杂的生产数据管理和报表生成任务。其他说明：文中提到的所有技术手段均经过实际测试验证，可在多个版本的WinCC环境中稳定运行。配套的视频教程进一步降低了学习门槛，使用户能够更快地上手操作。

ANPC并网逆变器的SPWM控制与电流闭环仿真实现: 内容概要：本文详细介绍了ANPC并网逆变器的闭环仿真建模过程，涵盖了直流电压源的稳定接入、SPWM调制、电流闭环控制以及锁相环的应用。作者通过具体的代码示例和技术细节，展示了如何利用SPWM生成稳定的正弦波，通过锁相环确保电流和电压的相位一致，并采用前馈解耦提高电流控制的精度。同时，文中还讨论了一些常见的仿真问题及其解决方案，如死区效应、调制比限制和电流环PI参数的优化。适合人群：电力电子工程师、控制系统设计师、从事逆变器研究的技术人员。使用场景及目标：适用于希望深入了解ANPC并网逆变器控制策略的研究人员和工程师，旨在帮助他们掌握SPWM调制、电流闭环控制和锁相环的设计与实现。其他说明：文章提供了丰富的代码片段和实践经验，有助于读者快速理解和应用相关技术。此外，文中提到的一些常见问题和解决方案也为实际项目提供了宝贵的参考。

groovy-3.0.7.jar中文文档.zip: # 压缩文件中包含：中文文档 jar包下载地址 Maven依赖 Gradle依赖源代码下载地址 # 本文件关键字： jar中文文档.zip,java,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压最外层zip，再解压其中的zip包，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件；

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论