hadoop CDH3u2
- 准备好eclipse并创建一个hadoop源码项目,将源码添加倒src path
- stop jobtracker(/etc/init.d/hadoop-0.20-jobtracker stop)
- vi bin/hadoop(添加红色部分)
...
elif [ "$COMMAND" = "jobtracker" ] ; then
CLASS=org.apache.hadoop.mapred.JobTracker
HADOOP_OPTS="$HADOOP_OPTS $HADOOP_JOBTRACKER_OPTS -Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=
8899"
...
- 启动jobtracker(/etc/init.d/hadoop-0.20-jobtracker start),此时会打印"Listening for transport dt_socket at address: 8899",但是jobtracker尚未启动。
- 右键hadoop src项目,右键“Debug As”,选择“Debug Configurations”,选择“Remote Java Application”,添加一个新的测试,输入远程host ip和监听端口,上例为8899,然后点击“Debug”按钮,jobtracker此时启动。
- 在hadoop 源码中添加断点,运行一个job,程序会自动暂停到断点位置,剩下的事情交给你了。
-- heipark
分享到:
相关推荐
Eclipse中远程调试Hadoop必备资料:hadoop-eclipse-plugin-1.1.1和hadoop-core-1.0.2-modified;已经在eclipse-jee-juno-SR1-win32-x86_64和hadoop1.1.1 下测试过。
8. **Eclipse连接远程Hadoop集群**:通过配置Eclipse中的Hadoop连接参数(如NameNode和JobTracker的地址),开发者可以在本地开发环境中调试和测试代码,而实际运行在远程集群上。 9. **环境设置**:在Windows系统...
Hadoop JobTracker 的 Mac 菜单栏应用程序界面。 它使您可以轻松访问 JobTracker 中的作业,并提供有关开始、完成和失败作业的 Growl/通知中心通知。 请参阅了解更多信息并下载二进制文件。 如果您有任何问题或...
在Windows 7环境下配置和远程调试Hadoop集群是一项挑战,但通过正确的方法和步骤,可以成功实现这一目标。以下是关于这个主题的详细知识: 1. **Hadoop简介**: Hadoop是由Apache基金会维护的一个分布式计算框架,...
在IT行业中,分布式计算系统是处理大规模数据的关键技术之一,Hadoop MapReduce就是其中的典型代表。本篇文章将深入探讨“远程调用执行Hadoop Map/Reduce”的概念、原理及其实现过程,同时结合标签“源码”和“工具...
windows下 eclipse操作hadoop集群 插件
Hadoop伪分布式部署文档是指在单台机器上模拟分布式Hadoop集群的部署文档,包括服务器伪分布式部署、本地Hadoop开发环境部署、Eclipse远程连接Hadoop服务器等内容。下面是该文档的详细解释: 首先,需要安装JDK,...
eclipse远程调试出现Exception in thread “main” java.lang.UnsatisfiedLinkError,eclipse4.5远程调试hadoop2.7.4依赖包 ,方法 将匹配的hadoop.dll、winutils.exe、libwinutils.lib拷贝到C:\Windows\System32 详情...
eclipse远程调试hadoop,报Could not locate executable null\bin\winutils.exe ,将winutils.exe放入到hadoop的bin目录下,报UnsatisfiedLinkError错,将 hadoop.dll放入C:\Windows\System32下
总的来说,myEclipse10.0与Hadoop集群的远程连接是大数据开发中的一个重要环节,它使得开发和测试Hadoop应用变得更加便捷。通过正确配置myEclipse、Hadoop集群以及编写MapReduce代码,开发者可以在本地环境中高效地...
idea hadoop-hdfs插件,和eclipse上一样的Hadoop hdfs的插件功能一样; 原生集群端口分别为50020和9000 cdh 集群 端口分别为8020和9000 ,不用点测试直接点应用即可
本文通过对 Hadoop 的深入分析和研究,根据交易记录查询系统的需求,设计并实现了 基于 Hadoop 的海量交易记录查询系统。首先对 Hadoop 及其相关技术做了研究,着重介绍了 Hadoop 云计算框架中的 HDFS 分布式文件...
在Windows环境下,使用Eclipse进行Hadoop 2.2.0分布式集群的调试是一项重要的技能,这可以帮助开发者更好地理解和优化Hadoop程序。以下是一些关键的知识点,将指导你完成这个过程。 首先,Hadoop是一个开源的分布式...
在Eclipse中远程连接到Hadoop集群,并通过HDFS的Java API操作文件是一套涉及多个步骤的技术流程,这套流程主要涉及到分布式计算和文件系统操作的知识。首先,我们来梳理一下整个过程中的关键知识点。 第一步:启动...
Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍 Hadoop 云计算 2.0 笔记第一课 Hadoop 介绍中,我们可以了解到 Hadoop 的生态系统特点、Hadoop 生态系统概况、Hadoop 生态系统版本衍化、下一代 Hadoop、Hadoop 学习...
【Hadoop第一次培训材料】是针对初学者设计的一份详细教程,旨在介绍分布式计算框架Hadoop的核心概念和技术。Hadoop是Apache软件基金会开发的一个开源项目,它为处理和存储大量数据提供了可扩展的、可靠的解决方案。...
1. **Hadoop日志管理**:在Hadoop作业执行过程中,会有如JobTracker(在Hadoop 1.x中)或YARN(在Hadoop 2.x及以上版本)这样的资源管理器生成作业相关的日志。这些日志可以帮助我们追踪作业的状态,如作业提交、...
标题“pc机连接集群的HADOOP_HOME”指的是在个人计算机(PC)上配置Hadoop环境,以便能够远程连接并操作一个Hadoop集群。 首先,我们来详细解释一下`HADOOP_HOME`。这是Hadoop环境中的一个重要变量,它指向Hadoop...