`
heipark
  • 浏览: 2091458 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

记录一次远程debug hadoop jobtracker

 
阅读更多
hadoop CDH3u2
  • 准备好eclipse并创建一个hadoop源码项目,将源码添加倒src path
  • stop jobtracker(/etc/init.d/hadoop-0.20-jobtracker stop)
  • vi bin/hadoop(添加红色部分)

...

elif [ "$COMMAND" = "jobtracker" ] ; then

  CLASS=org.apache.hadoop.mapred.JobTracker

  HADOOP_OPTS="$HADOOP_OPTS $HADOOP_JOBTRACKER_OPTS -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=

8899"

...

 

 

  • 启动jobtracker(/etc/init.d/hadoop-0.20-jobtracker start),此时会打印"Listening for transport dt_socket at address: 8899",但是jobtracker尚未启动。
  • 右键hadoop src项目,右键“Debug As”,选择“Debug Configurations”,选择“Remote Java Application”,添加一个新的测试,输入远程host ip和监听端口,上例为8899,然后点击“Debug”按钮,jobtracker此时启动。
  • 在hadoop 源码中添加断点,运行一个job,程序会自动暂停到断点位置,剩下的事情交给你了。

调试mapreduce见我另一篇文章《远程Hadoop调试——mapreduce函数调试篇

-- heipark


 

分享到:
评论

相关推荐

    Eclipse中远程调试Hadoop必备资料

    Eclipse中远程调试Hadoop必备资料:hadoop-eclipse-plugin-1.1.1和hadoop-core-1.0.2-modified;已经在eclipse-jee-juno-SR1-win32-x86_64和hadoop1.1.1 下测试过。

    hadoop远程访问资料

    8. **Eclipse连接远程Hadoop集群**:通过配置Eclipse中的Hadoop连接参数(如NameNode和JobTracker的地址),开发者可以在本地开发环境中调试和测试代码,而实际运行在远程集群上。 9. **环境设置**:在Windows系统...

    JobTracker:Hadoop JobTracker OS X 菜单栏应用程序

    Hadoop JobTracker 的 Mac 菜单栏应用程序界面。 它使您可以轻松访问 JobTracker 中的作业,并提供有关开始、完成和失败作业的 Growl/通知中心通知。 请参阅了解更多信息并下载二进制文件。 如果您有任何问题或...

    hadoop2.6(x64)Win7上远程调试hadoop 集群

    在Windows 7环境下配置和远程调试Hadoop集群是一项挑战,但通过正确的方法和步骤,可以成功实现这一目标。以下是关于这个主题的详细知识: 1. **Hadoop简介**: Hadoop是由Apache基金会维护的一个分布式计算框架,...

    远程调用执行Hadoop Map/Reduce

    在IT行业中,分布式计算系统是处理大规模数据的关键技术之一,Hadoop MapReduce就是其中的典型代表。本篇文章将深入探讨“远程调用执行Hadoop Map/Reduce”的概念、原理及其实现过程,同时结合标签“源码”和“工具...

    eclipse远程连接hadoop集群 hadoop-eclipse-plugin-2.6.0.jar

    windows下 eclipse操作hadoop集群 插件

    Hadoop伪分布式部署文档(包括本地开发环境,eclipse远程连接Hadoop服务器)

    Hadoop伪分布式部署文档是指在单台机器上模拟分布式Hadoop集群的部署文档,包括服务器伪分布式部署、本地Hadoop开发环境部署、Eclipse远程连接Hadoop服务器等内容。下面是该文档的详细解释: 首先,需要安装JDK,...

    eclipse4.5远程调试hadoop2.7.4依赖包

    eclipse远程调试出现Exception in thread “main” java.lang.UnsatisfiedLinkError,eclipse4.5远程调试hadoop2.7.4依赖包 ,方法 将匹配的hadoop.dll、winutils.exe、libwinutils.lib拷贝到C:\Windows\System32 详情...

    eclipse 64位 远程调试hadoop2.5

    eclipse远程调试hadoop,报Could not locate executable null\bin\winutils.exe ,将winutils.exe放入到hadoop的bin目录下,报UnsatisfiedLinkError错,将 hadoop.dll放入C:\Windows\System32下

    myEclipse10.0与hadoop集群远程连接

    总的来说,myEclipse10.0与Hadoop集群的远程连接是大数据开发中的一个重要环节,它使得开发和测试Hadoop应用变得更加便捷。通过正确配置myEclipse、Hadoop集群以及编写MapReduce代码,开发者可以在本地环境中高效地...

    idea 配置连接远程hadoop 插件

    idea hadoop-hdfs插件,和eclipse上一样的Hadoop hdfs的插件功能一样; 原生集群端口分别为50020和9000 cdh 集群 端口分别为8020和9000 ,不用点测试直接点应用即可

    基于Hadoop的海量交易记录查询系统研究

    本文通过对 Hadoop 的深入分析和研究,根据交易记录查询系统的需求,设计并实现了 基于 Hadoop 的海量交易记录查询系统。首先对 Hadoop 及其相关技术做了研究,着重介绍了 Hadoop 云计算框架中的 HDFS 分布式文件...

    如何在Windows下的eclipse调试Hadoop2.2.0分布式集群

    在Windows环境下,使用Eclipse进行Hadoop 2.2.0分布式集群的调试是一项重要的技能,这可以帮助开发者更好地理解和优化Hadoop程序。以下是一些关键的知识点,将指导你完成这个过程。 首先,Hadoop是一个开源的分布式...

    ecplise远程连接hadoop--hdfs java api操作文件.pdf

    在Eclipse中远程连接到Hadoop集群,并通过HDFS的Java API操作文件是一套涉及多个步骤的技术流程,这套流程主要涉及到分布式计算和文件系统操作的知识。首先,我们来梳理一下整个过程中的关键知识点。 第一步:启动...

    Hadoop云计算2.0笔记第一课Hadoop介绍

    Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍 Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍中,我们可以了解到 Hadoop 的生态系统特点、Hadoop 生态系统概况、Hadoop 生态系统版本衍化、下一代 Hadoop、Hadoop 学习...

    Hadoop第一次培训材料

    【Hadoop第一次培训材料】是针对初学者设计的一份详细教程,旨在介绍分布式计算框架Hadoop的核心概念和技术。Hadoop是Apache软件基金会开发的一个开源项目,它为处理和存储大量数据提供了可扩展的、可靠的解决方案。...

    hadoop作业记录档案

    1. **Hadoop日志管理**:在Hadoop作业执行过程中,会有如JobTracker(在Hadoop 1.x中)或YARN(在Hadoop 2.x及以上版本)这样的资源管理器生成作业相关的日志。这些日志可以帮助我们追踪作业的状态,如作业提交、...

    pc机连接集群的HADOOP_HOME

    标题“pc机连接集群的HADOOP_HOME”指的是在个人计算机(PC)上配置Hadoop环境,以便能够远程连接并操作一个Hadoop集群。 首先,我们来详细解释一下`HADOOP_HOME`。这是Hadoop环境中的一个重要变量,它指向Hadoop...

Global site tag (gtag.js) - Google Analytics