`

Kettle Linux 安装部署

阅读更多
一.安装JDK环境:根据自己的linux系统选择相应的版本,比如我的centos7是x64的,所以我选择jdk-8u74-linux-x64.tar.gz下载
下载下来以后,我们将其移到我们创建的一个目录中,存放tar包的目录为/usr/local/src/jdk,然后解压:
tar -zxf /usr/local/src/jdk/jdk-7u65-linux-x64.tar.gz
编辑 vi /etc/profile 文件
在文件后面添加:
export JAVA_HOME=/usr/local/src/jdk/jdk1.8.0_74
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:$CLASSPATH:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH
执行 . /etc/profile
配置成功后,关闭终端,重新进入,输入java –version 如果出现版本号什么的,就证明jdk安装成功

二.将data-integration文件夹直接拷贝到/usr/local/kettle文件夹下面
cd /usr/local/kettle/data-integration 进入该目录
为所有.sh文件赋予执行权限
chmod +x *.sh
然后在终端键入./kitchen.sh 如果出现帮助信息,说明kettle安装成功
./kitchen.sh   -----运行job
           ./span.sh     -----运行转换
1.       在kettle下建立data 文件夹,用来存放转换和job文件
          建立ktllog 文件夹,用来存放日志文件
          建立ktlsh 文件夹,用来存放脚本文件
1.       在ktlsh文件夹中新建执行job的文件,
新建文件命令: touch xxx.sh
并赋予文件执行权限
chmod  +x  xxx.sh

编辑xxx.sh文件
Vi xxx.sh
输入 :
#!/bin/sh
source /etc/profile  配置环境变量(使用crontab时候,由于crontab不识别系统的环境变量,所以需要我们这边再配置一遍)

ROOT_TOPDIR=/usr/local/kettle
export ROOT_TOPDIR     --设置kettle目录
$ROOT_TOPDIR/data-integration/kitchen.sh –file=需要执行的job的文件(绝对路径)

保存!

可在ktlsh目录下直接执行./xxx.sh 文件运行
三. 可以直接启动./spoon.sh 进行可视化设置,测试数据库,Hadoop连接
   /root/.kettle/kettle.properties 进行环境变量赋值

四.任务调度
vim /etc/crontab
0 0 * * *  root sh /myhome/usr/kettle/ktlsh/jdt_custom.sh >> /myhome/usr/kettle/ktllog/jdtcustomlog
分享到:
评论

相关推荐

    Kettle在Linux的安装使用

    【Kettle在Linux的安装使用】知识详解 Kettle,又称Pentaho Data Integration (PDI),是一款开源的数据集成工具,常用于数据提取、转换和加载(ETL)过程。在Linux环境中安装和使用Kettle,需要遵循一定的步骤。...

    linux centos环境kettle部署与定时作业执行

    Linux Centos 环境 Kettle 部署与定时...Linux Centos 环境 Kettle 部署与定时作业执行需要安装和配置 java 环境,下载和部署 Kettle,配置定时作业执行命令。同时,需要注意一些注意事项,以确保 Kettle 的正常运行。

    Kettle Linux环境部署.docx

    总的来说,Kettle在Linux环境的部署涉及JDK的安装、Kettle软件的解压、启动脚本的创建、Job文件的上传、环境变量的配置以及定时任务的设定。遇到问题时,需要根据错误信息针对性地解决依赖库缺失或其他系统级别的...

    Linux_下部署Kettle

    Linux_下部署Kettle,Linux_下部署Kettle,Linux_下部署Kettle

    解决Linux部署kettle报错缺少libwebkitgtk问题

    在Linux环境中部署Kettle(Pentaho Data Integration,也称为Kettle或PDI)时,可能会遇到因缺少libwebkitgtk库导致的运行错误。libwebkitgtk是WebKitGTK+的一个库,用于提供GTK+应用程序的Web渲染引擎,它使得在...

    linux环境下部署kettle,执行kitchen.sh文件报错后提示安装 libwebkitgt.zip

    亲测好用 kettle-linux环境下部署kettle,执行kitchen.sh文件报错后安装 libwebkitgtk,提示没有可用软件包libwebkitgtk 详细流程:https://blog.csdn.net/m0_37618809/article/details/81015492#commentBox

    kettle部署

    Kettle 部署指南 Kettle 是一款功能强大的 ETL 工具,对于...Kettle 部署在 Linux 平台下需要安装 Kettle 软件、配置 JDK 环境和安装最新版本的 JDK。同时,我们需要使用 Linux 远程工具来管理和维护 Kettle 环境。

    【文件】Kettle61安装部署及使用教程贵在详细截图说明.pdf

    Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把各种数据放到一个壶里,然后以一种...

    kettle安装部署-liunx

    根据给定的文件信息“kettle安装部署-Linux”,本文将详细介绍Kettle在Linux环境下的安装与部署过程,包括Kettle的基本概念、安装前的准备、具体的安装步骤以及配置优化等方面,力求为读者提供一份全面详尽的指南。...

    linux下部署kettle.txt

    Linux系统下面kettle的部署手册,详细介绍了部署步骤,使用的命令等

    linux环境下部署kettle,执行kitchen.sh文件报错后提示安装 libwebkitgtk 所需rpm包

    在Linux环境中部署Kettle数据集成工具时,可能会遇到一些依赖性问题,特别是在执行`kitchen.sh`脚本时。Kettle(也称为Pentaho Data Integration或PDI)是一款强大的ETL(Extract, Transform, Load)工具,它依赖于...

    linux环境下部署kettle,libwebkitgtk的rpm安装包,执行kitchen.sh文件报错后安装 libwebkitgtk,所需rpm安装包

    在Linux环境中部署Kettle,一个基于Java的数据集成工具,可能会遇到一些依赖问题,尤其是在执行其命令行客户端`kitchen.sh`时。这个问题通常涉及到与Webkit相关的库,如`libwebkitgtk`。Kettle在处理HTML或者Web页面...

    linux下kettle7.1部署和使用借鉴.pdf

    本文主要介绍了在 Linux 环境下部署和使用 Kettle 7.1 的详细步骤,从软件下载、环境准备、第三方软件安装、Kettle 安装、使用 Kettle 进行数据更新等方面进行了详细的介绍。 一、软件下载 在本文中,我们使用的是...

    【文件】Kettle61安装部署及使用教程贵在详细截图说明.docx

    【Kettle 概念】 Kettle 是一个强大的开源数据提取、...通过以上介绍,你已经掌握了 Kettle 的基本概念、安装部署、环境配置以及组件的使用方法。继续深入学习,你将能够利用 Kettle 实现复杂的数据集成和转换任务。

    Kettle部署操作手册

    ### Kettle部署操作手册知识点详解 #### 一、Kettle简介 Kettle是一款国外开源的ETL(Extract-Transform-Load)工具,以其高效的性能和稳定性受到广泛欢迎。这款工具完全采用Java语言编写,能够在多种操作系统上...

    Kettle-6.1安装部署及使用教程-贵在详细截图说明

    ### Kettle-6.1 安装部署及使用教程 #### 一、Kettle概述 Kettle是一款由Pentaho公司开发的开源ETL(Extract, Transform, Load)工具,其主要功能是从不同的数据源中抽取数据,进行清洗、转换等处理后,再加载到目标...

Global site tag (gtag.js) - Google Analytics