`
wangzjie
  • 浏览: 74973 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop远程调试

阅读更多

由于mapreduce为child进程,所以不能直接通过bin/hadoop文件中开启远程调试端口,具体操作如下:

1、 选定一台调试机器,修改mapred-site.xml文件,添加如下配置:

  1. <property>  
  2.   <name>mapred.child.java.opts</name>  
  3.   <value>-agentlib:jdwp=transport=dt_socket,address=8883,server=y,suspend=y</value>  
  4. </property>  

2、关闭所有的tasktracker,只保留上面配置的一台需要调试的tasktracker

3、启动Mapreduce job

4、mapreduce任务会在map阶段时进行等待(终端的显示是一直停留在0%),这时就可以利用eclipse或idea的remote debug进行远程调试,连接上后,map任务就往下执行,也就可以调试了。

      map任务完成后,到reduce阶段时又会进入等待,还需要进行一次remote debug.

分享到:
评论

相关推荐

    Eclipse中远程调试Hadoop必备资料

    Eclipse中远程调试Hadoop必备资料:hadoop-eclipse-plugin-1.1.1和hadoop-core-1.0.2-modified;已经在eclipse-jee-juno-SR1-win32-x86_64和hadoop1.1.1 下测试过。

    hadoop远程访问资料

    标题 "hadoop远程访问资料" 涉及到的核心知识点主要集中在如何在Java环境中通过Eclipse等开发工具,实现对Hadoop集群的远程访问和管理,尤其是与NameNode和DataNode节点的交互。Hadoop是一个分布式文件系统,...

    hadoop2.6(x64)Win7上远程调试hadoop 集群

    在Windows 7环境下配置和远程调试Hadoop集群是一项挑战,但通过正确的方法和步骤,可以成功实现这一目标。以下是关于这个主题的详细知识: 1. **Hadoop简介**: Hadoop是由Apache基金会维护的一个分布式计算框架,...

    传智黑马赵星老师hadoop七天课程资料笔记-第三天(全)

    5. **hadoop远程调试.txt** - 文件名暗示了如何远程调试Hadoop程序,这对于开发者在分布式环境中解决问题至关重要,可能涵盖了使用IDE(如Eclipse)的远程调试配置和技巧。 6. **MR执行流程笔记.txt** - MapReduce...

    eclipse调试hadoop2.x必备

    总结,要在Windows 7上的Eclipse环境中调试Hadoop 2.x,你需要正确配置Java环境,安装Eclipse并设置Hadoop的开发环境,创建远程调试配置,以及处理Windows特有的`hadoop.dll`和`winutils.exe`文件。这个过程需要对...

    远程调用执行Hadoop Map/Reduce

    6. **源码解析**:理解Hadoop MapReduce的源码有助于优化和调试作业。例如,`org.apache.hadoop.mapred.MapTask`和`org.apache.hadoop.mapreduce.ReduceTask`分别对应Map和Reduce任务的实现,开发者可以通过阅读这些...

    eclipse4.5远程调试hadoop2.7.4依赖包

    eclipse远程调试出现Exception in thread “main” java.lang.UnsatisfiedLinkError,eclipse4.5远程调试hadoop2.7.4依赖包 ,方法 将匹配的hadoop.dll、winutils.exe、libwinutils.lib拷贝到C:\Windows\System32 详情...

    eclipse 64位 远程调试hadoop2.5

    eclipse远程调试hadoop,报Could not locate executable null\bin\winutils.exe ,将winutils.exe放入到hadoop的bin目录下,报UnsatisfiedLinkError错,将 hadoop.dll放入C:\Windows\System32下

    Hadoop在Windows下用IDEA调试

    在Hadoop的启动命令中启用远程调试模式,通常通过添加`-agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=5005`这样的参数来实现,其中5005是调试端口。 现在我们可以开始调试Hadoop源码了。在IDEA中...

    winutils.exe/hadoop.dll下载,IDE调试hadoop程序。

    同时,掌握如何配置IDE以进行远程调试,以及熟悉SSH工具的使用,也是提高工作效率的重要技能。通过这些工具和技术,开发者可以在保持本地开发便利性的同时,无缝地与远程Hadoop集群交互,从而实现高效的大数据开发...

    myEclipse10.0与hadoop集群远程连接

    将myEclipse与Hadoop集群远程连接起来,可以方便地在开发环境中编写、测试和部署Hadoop应用程序,从而实现高效的数据分析和处理。 首先,我们需要了解myEclipse中的远程系统视图(Remote Systems View)。这是...

    如何使用eclipse调试Hadoop作业

    对于远程调试,你可能需要在Hadoop集群上启动作业时启用调试模式。在启动JobTracker或YARN的ApplicationMaster时,添加"-Dmapred.child.java.opts=-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,...

    修改hadoop中的io写的,远程调用对象的东西。

    标签中的"源码"和"工具"提示我们,可能需要查看Hadoop的源代码来理解其内部工作原理,并利用Hadoop提供的工具(如Hadoop命令行工具、Hadoop配置工具等)进行调试和测试。 8. **案例研究**: 博文链接中提到的内容...

    如何在Windows下的eclipse调试Hadoop2.2.0分布式集群

    这需要在Hadoop集群的每个节点上开启远程调试选项,并在Eclipse中配置相应的远程调试端口。 8. **日志与跟踪**: Hadoop提供详细的日志系统,可以通过HDFS或控制台查看运行日志,这对调试非常有帮助。同时,可以...

    Windows7下eclipse调试Fedora虚拟机的hadoop+hbase伪分布式

    利用Windows7作为主机,通过VMware虚拟化技术运行Fedora操作系统,并在此环境中搭建Hadoop和HBase的伪分布式环境,最后在Windows下的Eclipse中配置相应的开发环境以进行远程调试。 一、环境版本要求和准备 为了...

    pc机连接集群的HADOOP_HOME

    为了在Eclipse中调试和运行Hadoop程序,你需要安装Hadoop插件(如Hadoop插件for Eclipse或Eclipse for Big Data Developers),同时确保`HADOOP_HOME`已经正确配置,这样Eclipse才能正确地构建和连接到Hadoop集群。...

    Windows下Eclispe远程开发Mapreduce程序

    用户可以在Eclipse中创建新的MapReduce项目,编写Mapper和Reducer代码,然后通过Eclipse的Map/Reduce透视图进行调试和运行,直接与远程的Hadoop集群进行交互。 总的来说,Windows下使用Eclipse远程开发MapReduce...

    hadoop-eclipse-plugin2.7.2-2.7.3-2.5.1.zip

    《Hadoop Eclipse Plugin 2.7.2:高效开发与远程调试工具》 在大数据处理领域,Apache Hadoop 是一个不可或缺的开源框架,它为分布式存储和计算提供了强大的支持。而为了方便Java开发者在Eclipse集成开发环境中进行...

Global site tag (gtag.js) - Google Analytics