`

调试hadoop的小技巧

阅读更多

在调试hadoop的时候,你第一点需要明确需要调试哪个类,然后调试时的上下文参数大概是什么样的,在上一篇里我讲了如何设置hadoop的调试,这里分享一点小的调试技巧。 

 

 

例如我需要知道调试的类和上下文参数,那其实在启动脚本里就有的,我们不妨在启动时将这些输出来看,例如在hadoop的

 

Python代码   收藏代码
  1. exec   "$JAVA"  $JAVA_HEAP_MAX $HADOOP_OPTS -classpath  "$CLASSPATH"  $CLASS  "$@"   

 

     这一行上面增加如下的echo语句

 

Python代码   收藏代码
  1. echo  "opts=$HADOOP_OPTS"        #一些额外设置的参数   
  2. #echo "classpath=$CLASSPATH"  #这个是所有的jar路径   
  3. echo "class=$CLASS"     #具体的调试类  看main函数   
  4. echo "params=$@"        #传递的参数   

 

   例如运行

 

Python代码   收藏代码
  1. hadoop  dfs -ls    

    将得到如下输出

 

Python代码   收藏代码
  1. opts=  -Dhadoop.log.dir=/home/dikar/Program/hadoop- 0.20 . 2 /bin/../logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/home/dikar/Program/hadoop- 0.20 . 2 /bin/.. -Dhadoop.id.str= -Dhadoop.root.logger=INFO,console -Djava.library.path=/home/dikar/Program/hadoop- 0.20 . 2 /bin/../lib/native/Linux-i386- 32  -Dhadoop.policy.file=hadoop-policy.xml  
  2. class =org.apache.hadoop.fs.FsShell  
  3. params=-ls  

 

   则知道调试时是需要进入  FsShell这个类

更多信息请查看 java进阶网 http://www.javady.com

分享到:
评论

相关推荐

    HADOOP 系统之hadoop pig hive 整合版

    **Hadoop The Definitive Guide** 这本书是Hadoop领域的权威指南,涵盖了Hadoop的安装、配置、优化以及各种实用技巧。通过阅读这本书,你可以深入了解Hadoop的内部工作机制,如何管理Hadoop集群,以及如何编写...

    Hadoop技术内幕:深入解析MapReduce架构设计与实现原理

    阅读源代码前的准备1.1 准备源代码学习环境1.1.1 基础软件下载1.1.2 ...技巧1.4 Hadoop源代码组织结构1.5 Hadoop初体验1.5.1 启动Hadoop1.5.2 Hadoop Shell介绍1.5.3 Hadoop Eclipse插件介绍1.6 编译及调试...

    hadooponwindows.zip

    7. **运行Hadoop应用程序**:在Windows上,开发者可以使用Eclipse或IntelliJ IDEA等集成开发环境,配合插件来编写、调试和运行Hadoop MapReduce程序。 8. **注意事项**:在Windows上运行Hadoop可能会遇到一些问题,...

    《Hadoop权威指南》示例代码

    这本书的示例代码是理解和学习Hadoop的重要资源,它提供了实践操作的实例,帮助读者掌握Hadoop的使用和开发技巧。 在Hadoop中,主要涉及以下几个关键知识点: 1. **Hadoop分布式文件系统(HDFS)**:HDFS是Hadoop的...

    hadoop2.7.3的源码包

    2. **MapReduce**:MapReduce是Hadoop的数据处理模型,它将大规模数据处理任务分解为多个小任务并行处理,然后合并结果。在源码中,我们可以探索Mapper、Reducer、Shuffle和Sort等阶段的实现细节。这对于理解数据...

    hadoop.rar

    Hadoop的单机模式是开发者在本地计算机上进行测试和调试的首选方式。在这种模式下,所有的Hadoop服务都在一个JVM(Java虚拟机)中运行,不涉及网络通信,因此简化了配置过程。尚硅谷大数据技术之Hadoop(入门)....

    hadoop大数据基础学习

    #### 六、Hadoop最佳实践与优化技巧 1. **性能优化**: - 适当调整HDFS的block size。 - 合理设置MapReduce的split size。 - 使用Combiner减少网络传输量。 2. **故障排查**: - 查看Hadoop日志文件。 - 使用...

    Hadoop 0.20.1 配置手册-高清pdf文字版

    通过学习《Hadoop 0.20.1 配置手册》,开发者和管理员可以掌握Hadoop集群的基础配置和高级调优技巧,从而更好地管理和利用大数据资源。同时,理解早期版本的Hadoop也有助于对比分析Hadoop的演进历程,进一步理解当前...

    Hadoop权威指南第3版PDF电子书下载带目录书签完整版

    6. **开发和运维**:对于开发者和运维人员,书中提供了实践指导,包括如何部署和配置Hadoop集群、监控和调试技巧,以及最佳实践。 7. **案例研究**:书中包含多个实际案例,展示了Hadoop在不同行业和领域的应用,...

    hadoop

    在描述中提到的博文链接,虽然具体内容没有提供,但通常这类博客会介绍 Hadoop 的使用经验、配置技巧或者解决实际问题的方法。博主可能分享了对 Hadoop 源码的理解,或者是关于如何利用 Hadoop 进行大数据分析的案例...

    hadoop源代码部分

    它将大型任务分解为多个小的Map任务和Reduce任务,这些任务可以在集群中的多台机器上并行执行。Map阶段处理输入数据,Reduce阶段聚合结果。源代码中,可以研究如何定义Mapper和Reducer类,以及JobTracker和...

    零基础学习hadoop编程篇.doc

    此外,掌握Eclipse的高级使用技巧,例如项目管理、调试、优化代码等,将大大提高开发效率。在Hadoop开发过程中,你可能还会遇到诸如数据处理、错误排查、性能调优等问题,这些都是需要逐步学习和实践的。 总之,零...

    Hadoop实战

    Hadoop的核心理念是通过将任务分割成小的块并跨多个处理器(通常为廉价的商用硬件)并行处理,从而快速高效地处理大数据集。这个过程基于著名的MapReduce编程模型,它是Hadoop进行大规模数据分析的核心。MapReduce...

    Hadoop.in.Practice.2nd.Edition

    9. **最佳实践**:提供关于集群管理、性能监控和调优的实用技巧,帮助读者提升Hadoop集群的稳定性和效率。 通过学习《Hadoop in Practice 2nd Edition》,无论是数据工程师、分析师还是开发者,都能系统地掌握...

    基础学习hadoop 编程篇.pdf

    2. **Hadoop-Eclipse-Plugin插件**:该插件允许开发者在Eclipse中远程连接到Hadoop集群,便于调试和测试MapReduce程序。 3. **运行Hadoop程序**:理解Hadoop的运行机制,包括HDFS(Hadoop Distributed File System...

    零基础学习hadoop编程篇.pdf

    - 学习使用Eclipse创建项目,编写并运行小程序实例,掌握Eclipse的基本技巧和快捷键,提高开发效率。 总的来说,Hadoop编程要求开发者具备扎实的Java基础,熟悉分布式计算概念,掌握必要的开发工具,并能搭建和...

    Hadoop开发第四期

    - **调试方法**: - **单元测试**:编写单元测试来验证MapReduce函数的正确性。 - **集成测试**:进行集成测试以确保整个流程的连贯性。 #### 十二、Hadoop中的tar命令的实现 - **背景**: - 在Hadoop中,`tar`...

Global site tag (gtag.js) - Google Analytics