Hadoop之OutputFormat

小网客

浏览: 1250914 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hadoop

版本：

2.2版

描述：

OutputFormat是设置MR的结果输出写操作格式，包括如何写？写那？也就是定义写规则

类代码：

抽象类定义：

public abstract RecordWriter<K, V> getRecordWriter(
		TaskAttemptContext context) throws IOException,
		InterruptedException;

public abstract void checkOutputSpecs(JobContext context)
		throws IOException, InterruptedException;

public abstract OutputCommitter getOutputCommitter(
		TaskAttemptContext context) throws IOException,
		InterruptedException;

获取RecordWriter定义了写的具体操作，那么他抽象的方法如下：

public abstract void write(K key, V value) throws IOException,
		InterruptedException;

public abstract void close(TaskAttemptContext context) throws IOException,
		InterruptedException;

也就是具体的写和资源关闭操作，比如LineRecordWriter那么他就是基于Key和Value分割然后直接写的操作
在OutputCommitter中定义了跟MRjob执行情况的一些操作，比如job启动，job失败等，其抽象操作如下：

public abstract void setupJob(JobContext jobContext) throws IOException;

@Deprecated
public void cleanupJob(JobContext jobContext) throws IOException {
}

public void commitJob(JobContext jobContext) throws IOException {
	cleanupJob(jobContext);
}

public void abortJob(JobContext jobContext, JobStatus.State state)
		throws IOException {
	cleanupJob(jobContext);
}

public abstract void setupTask(TaskAttemptContext taskContext)
		throws IOException;

public abstract boolean needsTaskCommit(TaskAttemptContext taskContext)
		throws IOException;

public abstract void commitTask(TaskAttemptContext taskContext)
		throws IOException;

public abstract void abortTask(TaskAttemptContext taskContext)
		throws IOException;

public boolean isRecoverySupported() {
	return false;
}

public void recoverTask(TaskAttemptContext taskContext) throws IOException {
}

在写的操作中需要核实资源是否够用，资源是否合理被操作等操作都是在checkOutputSpecs中进行的

0
顶

0
踩

分享到：

利用freemarker做html页面静态化 | Java之UncaughtExceptionHandler

2014-01-23 16:02
浏览 1086
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop之OutputFormat

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop之OutputFormat

评论

发表评论

相关推荐

hadoop2.7.2在Ubuntu12.04下分布式安装指南

Hadoop之YARN安装部署

Hive之insert into 和insert overwrite

Hive之partition

Hive之内部表和外部表

Hadoop之TeraSort

Hadoop之wordcount性能测试

Hadoop之RandomTextWriter使用

Hadoop之mrbench

YARN异常: we cannot start a localDataXceiverServer because libhadoop cannot解决方法

最近访客更多访客>>