Hadoop调试信息的输出办法 - 东拉西扯到天明 - ITeye博客

`

poson

浏览: 369795 次
性别:
来自: 杭州

最近访客更多访客>>

as1100012811

pengcong90

nitidstar

无量

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

guji528：很好，清晰明了！
(8)python教程：几行代码搞定python 设计模式
poson：为什么踩啊？
三言两语谈团队合作
andyhelberg：你好，想请教一下关于应用敏捷开发在软件维护过程的经验。欢迎与我 ...
对scrum开发的感受
poson： chenwq 写道可以提供behavior targeting ...
最近公司培训的算法
chenwq：可以提供behavior targeting 相关材料不？先谢 ...
最近公司培训的算法

Hadoop调试信息的输出办法

博客分类：

hadoop

Hadoop Office Microsoft XML

阅读更多

Hadoop

调试是比较麻烦的事情，考虑到只能通过reduce输出数据，我们可以把调试信息输出到reduce中，然后固定到某个文件中。<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

我们可以把所有的调试数据都是用key=“Debug”，调试信息作为value=“debugInfo”。

（1）在map中直接使用

output.collect(new Text("debug"), new Text("调试信息"));

（2）在reduce中判断

if(key.equals("debug")) 

{

while(values.hasNext()) 

{

Stringline=values.next().toString();

output.collect(newText("debug"),newText(line)); 

}

}

(3)

增加类ReportOutFormat

publicstaticclassReportOutFormat<KextendsWritableComparable<?>,VextendsWritable> 
extendsMultipleOutputFormat<K,V>{


privateTextOutputFormat<K,V>theTextOutputFormat=null; 

@Override

protectedRecordWriter<K,V>getBaseRecordWriter(FileSystemfs, 
JobConfjob,Stringname,Progressablearg3)throwsIOException{

if(theTextOutputFormat==null){ 

theTextOutputFormat=newTextOutputFormat<K,V>(); 
}

returntheTextOutputFormat.getRecordWriter(fs,job,name,arg3); 
}

@Override

protectedStringgenerateFileNameForKeyValue(Kkey,Vvalue,Stringname){ 

if(key.equals("debug"))///注意这个判断 

return"debug"+name; 

returnname; 
}
}

（

4）在configJob里面添加代码

protectedvoidconfigJob(JobConfconf) 
{

conf.setMapOutputKeyClass(Text.class); 

conf.setMapOutputValueClass(Text.class); 

conf.setOutputKeyClass(Text.class); 

conf.setOutputValueClass(Text.class); 

conf.setOutputFormat(ReportOutFormat.class);//增加该行 
}

这样在输出文件中我们就可以得到调试信息了。这个办法有点曲线救国的意思，不知道有没有其他方便的办法。

分享到：

排序算法中比较函数的运用 | 编写hadoop程序的注意事项

2008-12-17 11:37
浏览 1629
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hadoop调试工具hadoop.dll和hadoop.exp和winutils.exe: 在Hadoop生态系统中，调试工具对于开发者和管理员来说至关重要，特别是在Windows环境中。本文将深入探讨三个关键组件：hadoop.dll、hadoop.exp和winutils.exe，以及它们在64位系统中的应用。这些组件主要用于在...

hadoop mapreduce helloworld 能调试: "Hadoop MapReduce HelloWorld 能调试" 的主题意味着我们将深入理解如何设置、运行以及调试 MapReduce 任务，特别是针对入门级的 "wordcount" 示例。 MapReduce 分为两个主要阶段：Map 阶段和 Reduce 阶段。Map ...

Hadoop本地调试NativeIO: 通过调整日志级别和输出格式，可以获取更详细的调试信息，帮助定位问题所在。 7. **问题排查**：常见的问题可能包括依赖库版本不兼容、编译选项错误、JNI（Java Native Interface）调用错误等。解决这些问题通常...

eclipse调试hadoop2.x必备: Eclipse则是一款强大的集成开发环境（IDE），支持多种编程语言，包括Java，是编写和调试Hadoop应用程序的首选工具。当我们需要在Windows 7操作系统上使用Eclipse进行Hadoop 2.x版本的开发和调试时，有一些关键步骤和...

Hadoop在Windows下用IDEA调试: 标题中的“Hadoop在Windows下用IDEA调试”意味着我们将探讨如何在Windows操作系统上使用IntelliJ IDEA（IDEA）这个流行的Java集成开发环境来调试Hadoop项目。Hadoop是一个开源的大数据处理框架，通常用于分布式存储...

Eclipse中远程调试Hadoop必备资料: Eclipse中远程调试Hadoop必备资料:hadoop-eclipse-plugin-1.1.1和hadoop-core-1.0.2-modified；已经在eclipse-jee-juno-SR1-win32-x86_64和hadoop1.1.1 下测试过。

hadoop数据输出压缩: 在探讨Hadoop数据输出压缩这一主题时，我们深入解析了Hadoop如何通过不同的压缩格式、工具及算法来优化数据处理效率。以下是对标题、描述、标签以及部分内容中提及的关键知识点的详细阐述： ### Hadoop数据输出压缩...

Hadoop本地调试 winutil.exe & hadoop.dll: Hadoop本地调试必要的文件 winutil.exe & hadoop.dll 使用方式：https://blog.csdn.net/qq_31772441/article/details/84076715

如何使用eclipse调试Hadoop作业: Eclipse作为一款强大的Java集成开发环境，为开发者提供了丰富的工具来调试Java应用程序，包括基于Hadoop的作业。本篇文章将详细阐述如何利用Eclipse有效地调试Hadoop作业，以及与之相关的源码分析和工具使用技巧。 ...

winutils.exe/hadoop.dll下载，IDE调试hadoop程序。: 在Windows环境下开发和调试Hadoop程序时，由于Windows系统与Hadoop原生环境（主要是Linux）的差异，可能会遇到一些挑战。"winutils.exe"和"hadoop.dll"是解决这些问题的关键工具。 **winutils.exe** 是Hadoop在...

Hadoop MapReduce多输出详细介绍: 在使用MapReduce框架时，经常需要处理输出数据，这时可能会遇到需要将输出分散到多个文件中的需求，这就是Hadoop MapReduce多输出功能的用途。Hadoop MapReduce多输出的功能主要由MultipleOutputFormat类及其相关类...

hadoop本地调试MR: IDEA hadoop本地调试MR windows-hadoop-bin 的压缩包，适合hadoop2.7.2以上，而且有详细的安装环境文档和错误的处理，一次通过

Hadoop IDEA 本地调试MR 包含文档和所有的资源: 4. **本地运行与调试**：`hadoop本地调试.txt`可能包含了详细的步骤和注意事项，通常包括如何配置项目的运行/调试配置，指定输入输出路径，以及设置主类。在IDEA中，你可以创建一个新的Run/Debug Configuration，...

hadoop-eclipse-plugin-2.6.0.jar.zip_2.6.0_hadoop_hadoop plugin: 2. **日志查看**：利用Eclipse的输出视图跟踪作业的运行状态和日志信息，帮助诊断问题。 3. **优化调试**：在调试时，可以设置断点，观察变量值，理解程序运行过程。 4. **代码复用**：使用Maven或Gradle构建系统...

基于Hadoop的微博信息挖掘: 基于Hadoop的微博信息挖掘本文设计了基于Hadoop的微博信息挖掘系统，解决了单一节点在分析微博海量数据的性能瓶颈问题。该系统利用分布式和虚拟化技术的优势，将微博信息获取和相关数据分析进行有机整合，实现了一...

hadoop中文乱码问题: 在实际操作中，可能需要结合日志信息和源码调试来定位问题。同时，建立良好的编码规范，统一数据的编码格式，也是防止乱码问题的重要措施。总之，理解和掌握Hadoop的字符编码机制，以及如何在不同阶段适配正确的...

本地调试所需hadoop包，hadoop-common-bin-master，winutils.exe: 在本地调试Hadoop时，首先需要确保你的系统已经安装了Java开发工具（JDK），因为Hadoop是基于Java的。然后，你需要设置HADOOP_HOME环境变量，指向解压后的Hadoop目录，并将bin目录添加到PATH环境变量中，这样就可以...

hadoop2.7.3 Winutils.exe hadoop.dll: 例如，开发人员可能需要使用Winutils.exe来获取HDFS上的文件信息，或者通过hadoop.dll来实现数据的读写操作。此外，当遇到性能问题或错误时，了解这些组件可以帮助定位问题所在，进行调试和优化。总的来说，Hadoop...

eclipse调试hadoop图示: ### Eclipse调试Hadoop知识点详解 #### 一、概述本文旨在详细介绍如何在Eclipse IDE中配置并调试Hadoop MapReduce应用程序。通过图文结合的方式，帮助读者理解每一步配置的具体操作与目的，确保能够顺利完成...

如何在Windows下的eclipse调试Hadoop2.2.0分布式集群: 在“Run Configurations”中，配置Hadoop Job运行参数，包括输入路径、输出路径、Job配置等。启动调试后，Eclipse会将JAR文件提交到Hadoop集群，并在遇到断点时暂停执行。 7. **远程调试**：对于分布式集群，你...

Global site tag (gtag.js) - Google Analytics