使用oozie调度sqoop从oracle导入hbase

tangjunliang

浏览: 110383 次
性别:
来自: 北京

最近访客更多访客>>

lingmincc

bruce__ray

luojianbing

kaogua

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

oozie

hadoop java oozie sqoop

   最近在使用sqoop把oracle中的数据导入到hbase中，表中的数据每个小时导入一次，使用oozie定时促发。

    hadoop版本：hadoop-2.0.0-cdh4.3.0
    oozie版本：oozie-3.3.2-cdh4.3.0
    sqoop版本：sqoop-1.4.3-cdh4.3.0

   相应的配置如下：
   coordinator.xml

   <coordinator-app name="cfg_check_formula-coord" frequency="${coord:hours(1)}" start="${start}" end="${end}" timezone="UTC"
                 xmlns="uri:oozie:coordinator:0.2">
    <controls>
        <concurrency>1</concurrency>
    </controls>

    <action>
        <workflow>
            <app-path>${nameNode}/user/${coord:user()}/${tescommRoot}/apps/sqoop/cfg_check_formula</app-path>
        </workflow>
    </action>
</coordinator-app>

workflow.xml

<workflow-app xmlns="uri:oozie:workflow:0.2" name="sqoop-cfg_check_formula-wf">
    <start to="sqoop-node"/>

    <action name="sqoop-node">
        <sqoop xmlns="uri:oozie:sqoop-action:0.2">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
  <!--          <prepare>
                <delete path="${nameNode}/user/${wf:user()}/${examplesRoot}/output-data/sqoop"/>
                <mkdir path="${nameNode}/user/${wf:user()}/${examplesRoot}/output-data"/>
            </prepare>
  -->
            <configuration>
                <property>
                    <name>mapred.job.queue.name</name>
                    <value>${queueName}</value>
                </property>
            </configuration>
            <arg>import</arg>
            <arg>--connect</arg>
            <arg>jdbc:oracle:thin:@127.0.0.1:1523:TEST</arg>
            <arg>--username</arg>
            <arg>ora</arg>
            <arg>--password</arg>
            <arg>111</arg>
            <arg>--m</arg>
            <arg>1</arg>
            <arg>--query</arg>
            <arg>SELECT ROWID, a.* FROM cfg_check_formula a WHERE $CONDITIONS</arg>
            <arg>--map-column-java</arg>
            <arg>ROWID=String</arg>
            <arg>--hbase-table</arg>
            <arg>cfg_check_formula</arg>
            <arg>--hbase-row-key</arg>
            <arg>ROWID</arg>
            <arg>--column-family</arg>
            <arg>f_cfg_check_formula</arg>
        </sqoop>
        <ok to="end"/>
        <error to="fail"/>
    </action>

    <kill name="fail">
        <message>Sqoop import cfg_check_formula failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <end name="end"/>
</workflow-app>

job.properties

nameNode=hdfs://master:8020
jobTracker=master:8032
queueName=default
testRoot=test
oozie.use.system.libpath=true
oozie.coord.application.path=${nameNode}/user/${user.name}/${testRoot}/apps/sqoop/cfg_check_formula
#start=2013-08-29T10:00Z
#end=2013-08-29T12:00Z
start=2013-09-04T11:00+0800
end=2013-09-04T12:00+0800

上述配置完后，在workflow目录下创建lib目录，把sqoop lib下的jar拷贝至这个目录下。这样我们就可以通过oozie定时启动这个导入任务。

分享到：

oozie CDH4和hadoop CDH4整合出现的问题( ... | 利用SQOOP将数据从数据库导入到HDFS

2013-09-04 16:48
浏览 3035
评论(1)
分类:开源软件
查看更多

1 楼 Molisa 2013-10-30

你好，我有两个问题请教一下：
1.为了密码安全，你有没有试过使用--password-file，将密码放在文件里？
你试过这种方式，可以找到密码，但是import会被执行多次，且最后造成整个Job失败。
2.能不能将密码放到job.properites文件里面,在arg tag里有${password}这种表达式取出来？
我试过了，似乎不能。

谢谢

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论