hadoopJob执行shell脚本

小网客

浏览: 1251068 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

MapReduce

需求：

1.基于hadoop jar 执行hadoop的job

2.参数也要可输入

3.shell脚本可供crontab调度

方式：

1.java解析输入的参数，并对参数进行规范定义

2.shell实现hadoop jar命令行执行，调度脚本用shell实现

3.crontab调度调度脚本

实现：

java解析输入参数：

/**
 * <pre>
 * 获取命令行参数，命令行job参数格式如下：
 * --param1  val1 \
 * --param2  val2 \
 * </pre>
 * 
 * @param args 命令行参数
 * @return 返回map参数映射对
 * @date 2013-11-13
 */
public Map<String, String> parseMRCommands(String[] args) {
	Map<String, String> commands = new HashMap<String, String>();
	String key = null;
	for (String cmdStr : args) {
		if (cmdStr.startsWith("--")) {
			if (key != null) {
				commands.put(key, "");
			}
			key = cmdStr.substring(2);
		} else {
			// add new command key:value
			commands.put(key, cmdStr);
			// clear key
			key = null;
		}
	}
	return commands;
}

输入的参数规范如下：

--param1 val1 \

shell执行脚本run.sh:

#! /bin/bash
hadoop jar ../lib/test-SNAPSHOT.jar com.test.TTask \
           --input.path.key /user/input/texts \
           --output.path.key /user/output/texts.out \

shell调度脚本cron-run.sh：

#!/bin/sh
#File:cron-run.sh
source /user/.bash_profile
cd $DEV_WORKING/mapred/bin
process_id=`jps -m | grep "TTask" | awk '{print $1}'`
process_id=${process_id:=0}
date 
if [ $process_id -gt 0 ] 
then
	echo "job is running, pid = $process_id" 
else 
	echo "pid is null, job runing now, start..." 
	nohup ./run.sh > run.log 2>&1 &
fi

然后就可以直接在crontab中对cron-run.sh做周期性调度

0
顶

0
踩

分享到：

hadoop集群直接数据拷贝 | Hadoop之MultipleOutputs

2013-11-15 13:12
浏览 2072
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoopJob执行shell脚本

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

hadoopJob执行shell脚本

评论

发表评论

相关推荐

Hadoop的MR中获取JobTracker配置

Hadoop之YARN安装部署

Yarn下的YarnChild启动个数决定参数

HDFS超租约异常（org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException）

hive执行hql脚本

NNBench执行过程和参数说明

yarn下的hdfs和mr性能调优参数一览表

hive安装部署之单用户模式

Hadoop之SafeModeException问题解决

Hadoop之RandomTextWriter使用

Hadoop之RandomTextWriter说明

Hadoop之mrbench

Hadoop之TestDFSIO

Hadoop之InputFormat

Hadoop之BloomFilter

HDFS Federation综述

Hadoop获取文件的元数据信息

Hadoop以某目录下的所有目录作为input源方式

Hadoop中map reduce和client共享数据源的方式

DataNode: Exception in BPOfferService for Block pool BP解决方法

最近访客更多访客>>