在调试hadoop的时候,你第一点需要明确需要调试哪个类,然后调试时的上下文参数大概是什么样的,在上一篇里我讲了如何设置hadoop的调试,这里分享一点小的调试技巧。
例如我需要知道调试的类和上下文参数,那其实在启动脚本里就有的,我们不妨在启动时将这些输出来看,例如在hadoop的
-
exec
"$JAVA"
$JAVA_HEAP_MAX $HADOOP_OPTS -classpath
"$CLASSPATH"
$CLASS
"$@"
这一行上面增加如下的echo语句
-
echo
"opts=$HADOOP_OPTS"
-
-
echo "class=$CLASS"
-
echo "params=$@"
例如运行
将得到如下输出
-
opts= -Dhadoop.log.dir=/home/dikar/Program/hadoop-
0.20
.
2
/bin/../logs -Dhadoop.log.file=hadoop.log -Dhadoop.home.dir=/home/dikar/Program/hadoop-
0.20
.
2
/bin/.. -Dhadoop.id.str= -Dhadoop.root.logger=INFO,console -Djava.library.path=/home/dikar/Program/hadoop-
0.20
.
2
/bin/../lib/native/Linux-i386-
32
-Dhadoop.policy.file=hadoop-policy.xml
-
class
=org.apache.hadoop.fs.FsShell
-
params=-ls
则知道调试时是需要进入 FsShell这个类
更多信息请查看 java进阶网 http://www.javady.com
分享到:
相关推荐
**Hadoop The Definitive Guide** 这本书是Hadoop领域的权威指南,涵盖了Hadoop的安装、配置、优化以及各种实用技巧。通过阅读这本书,你可以深入了解Hadoop的内部工作机制,如何管理Hadoop集群,以及如何编写...
阅读源代码前的准备1.1 准备源代码学习环境1.1.1 基础软件下载1.1.2 ...技巧1.4 Hadoop源代码组织结构1.5 Hadoop初体验1.5.1 启动Hadoop1.5.2 Hadoop Shell介绍1.5.3 Hadoop Eclipse插件介绍1.6 编译及调试...
7. **运行Hadoop应用程序**:在Windows上,开发者可以使用Eclipse或IntelliJ IDEA等集成开发环境,配合插件来编写、调试和运行Hadoop MapReduce程序。 8. **注意事项**:在Windows上运行Hadoop可能会遇到一些问题,...
这本书的示例代码是理解和学习Hadoop的重要资源,它提供了实践操作的实例,帮助读者掌握Hadoop的使用和开发技巧。 在Hadoop中,主要涉及以下几个关键知识点: 1. **Hadoop分布式文件系统(HDFS)**:HDFS是Hadoop的...
2. **MapReduce**:MapReduce是Hadoop的数据处理模型,它将大规模数据处理任务分解为多个小任务并行处理,然后合并结果。在源码中,我们可以探索Mapper、Reducer、Shuffle和Sort等阶段的实现细节。这对于理解数据...
Hadoop的单机模式是开发者在本地计算机上进行测试和调试的首选方式。在这种模式下,所有的Hadoop服务都在一个JVM(Java虚拟机)中运行,不涉及网络通信,因此简化了配置过程。尚硅谷大数据技术之Hadoop(入门)....
#### 六、Hadoop最佳实践与优化技巧 1. **性能优化**: - 适当调整HDFS的block size。 - 合理设置MapReduce的split size。 - 使用Combiner减少网络传输量。 2. **故障排查**: - 查看Hadoop日志文件。 - 使用...
通过学习《Hadoop 0.20.1 配置手册》,开发者和管理员可以掌握Hadoop集群的基础配置和高级调优技巧,从而更好地管理和利用大数据资源。同时,理解早期版本的Hadoop也有助于对比分析Hadoop的演进历程,进一步理解当前...
6. **开发和运维**:对于开发者和运维人员,书中提供了实践指导,包括如何部署和配置Hadoop集群、监控和调试技巧,以及最佳实践。 7. **案例研究**:书中包含多个实际案例,展示了Hadoop在不同行业和领域的应用,...
在描述中提到的博文链接,虽然具体内容没有提供,但通常这类博客会介绍 Hadoop 的使用经验、配置技巧或者解决实际问题的方法。博主可能分享了对 Hadoop 源码的理解,或者是关于如何利用 Hadoop 进行大数据分析的案例...
它将大型任务分解为多个小的Map任务和Reduce任务,这些任务可以在集群中的多台机器上并行执行。Map阶段处理输入数据,Reduce阶段聚合结果。源代码中,可以研究如何定义Mapper和Reducer类,以及JobTracker和...
此外,掌握Eclipse的高级使用技巧,例如项目管理、调试、优化代码等,将大大提高开发效率。在Hadoop开发过程中,你可能还会遇到诸如数据处理、错误排查、性能调优等问题,这些都是需要逐步学习和实践的。 总之,零...
Hadoop的核心理念是通过将任务分割成小的块并跨多个处理器(通常为廉价的商用硬件)并行处理,从而快速高效地处理大数据集。这个过程基于著名的MapReduce编程模型,它是Hadoop进行大规模数据分析的核心。MapReduce...
9. **最佳实践**:提供关于集群管理、性能监控和调优的实用技巧,帮助读者提升Hadoop集群的稳定性和效率。 通过学习《Hadoop in Practice 2nd Edition》,无论是数据工程师、分析师还是开发者,都能系统地掌握...
2. **Hadoop-Eclipse-Plugin插件**:该插件允许开发者在Eclipse中远程连接到Hadoop集群,便于调试和测试MapReduce程序。 3. **运行Hadoop程序**:理解Hadoop的运行机制,包括HDFS(Hadoop Distributed File System...
- 学习使用Eclipse创建项目,编写并运行小程序实例,掌握Eclipse的基本技巧和快捷键,提高开发效率。 总的来说,Hadoop编程要求开发者具备扎实的Java基础,熟悉分布式计算概念,掌握必要的开发工具,并能搭建和...
- **调试方法**: - **单元测试**:编写单元测试来验证MapReduce函数的正确性。 - **集成测试**:进行集成测试以确保整个流程的连贯性。 #### 十二、Hadoop中的tar命令的实现 - **背景**: - 在Hadoop中,`tar`...