JobClient应用概述 -

dajuezhao

浏览: 61714 次
性别:
来自: 北京

最近访客更多访客>>

wjboy49

jaydonluo

追求卓绝

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

JobClient应用概述

博客分类：

hadoop

Hadoop Gmail 设计模式 Apache

一、应用背景

由于在设计中有一个模块是对Job的管理，所以，在这里我采用了JobClinet来进行简单的控制。

二、应用点

JobClient指的是org.apache.hadoop.mapred.JobClient这个类。里面有不少的方法，我这里列举一些我用到的和一些需要注意的方法。

1、JobClient的实例化。这里有2中方法，一种是new JobClient(new JobConf);另外一种是实例化IP地址和端口。

2、通过JobClient获取Job列表。

JobClient.jobsToComplete()返回没有完成和没有失败的Job。换句话说就是在运行的Job。

JobClient.getAllJobs()返回所有的Job，不管是失败还是成功的。

3、获取JobID

JobID是一个Job的唯一标识，如果要获取指定的JobID，那么需要有根据，例如UserName。我这里是通过User来获取JobID。方法是遍历Job，然后找到名称相匹配的Job，然后取出ID。

4、通过线程阻塞的模式来等待Job执行完成。

JobClient.getJob(JobID).waitForCompletion();

三、总结

1、JobClient的应用很简单，总的说来就那么几种，细致看一下API就会大部分的应用。

2、通过JobClient还可以对task进行监控，也可以获取Job的进度百分比。

3、写的比较简单，写的不对或是有疑问可以发邮件dajuezhao@gmail.com

分享到：

通过Hadoop的API对Job进行管理 | Map/Reduce中Join查询实现

2010-10-27 09:23
浏览 1489
评论(1)
分类:企业架构
查看更多

1 楼 scu_cxh 2012-04-13

您好，我在学习hadoop方面的东西，想做一个对task监控的工具，但是没有什么思路，上面看到您提到可以通过JobClient可以监控到task的情况，能否指点下？

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

JobClient应用概述

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

JobClient应用概述

评论

发表评论

相关推荐

Hadoop的基准测试工具使用(部分转载)

分布式集群中的硬件选择

Map/Reduce的内存使用设置

Hadoop开发常用的InputFormat和OutputFormat(转)

SecondaryNamenode应用摘记

Zookeeper分布式安装手册

Hadoop分布式安装

Map/Reduce使用杂记

Hadoop中自定义计数器

Map/Reduce中的Partiotioner使用

Map/Reduce中的Combiner的使用

Hadoop中DBInputFormat和DBOutputFormat使用

Hadoop的MultipleOutputFormat使用

Map/Reduce中公平调度器配置

无法启动Datanode的问题

Map/Reduce的GroupingComparator排序简述

Map/Reduce中分区和分组的问题

关于Map和Reduce最大的并发数设置

关于集群数据负载均衡

Map/Reduce执行流程简述

最近访客更多访客>>