本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
使用Kettle进行数据迁移(ETL)
由于开发新的系统,需要将之前一个老的C/S应用的数据按照新的数据设计导入到新库中。此过程可能涉及到表结构不一致、大数据量(千万级,甚至上亿)等情况,包括异构数据的抽取、清洗等等工作。部分复杂的工作需要我们的DBA写代码用程序在JDBC或者Delphi中解决,而大部分稍简单的数据的迁移需要一个强大的ETL工具来解决。某日,技术经理让我找一个满足我们项目数据迁移需求的稳定、高效ETL工具。google ...
java程序生成kettle转换ktr文件
说明:C:\Users\Administrator\esapi下ESAPI.properties和validation.properties
package rh;
import java.io.File;
public class TransDemo {
public static TransDemo transDemo;
/**
...
Java程序调用kettle中的job(.kjb)和Trans(.ktr)
package com.p.serv.util;
import org.pentaho.di.core.KettleEnvironment;
import org.pentaho.di.core.exception.KettleException;
import org.pentaho.di.core.exception.KettleXMLException;
import o ...
开源ETL工具kettle--数据迁移
背景
由于项目的需求,需要将数据从Oracle迁移到MSSQL,不是简单的数据复制,而是表结构和字段名都不一样,甚至需要处理编码规范不一致的情况,如下图所示
注意:Oracle和MSSQL中的同名表的字段名是不相同的
如果要是采用手工SQL语句操作的话会很麻烦,需要考虑
Oracle和MSSQL SQL语法的差异数据从抓取--转化--加载迁移的过程安排字段的映射外键的约 ...
kettle动态设置输入文件路径
一般生产环境的导入文件的路径都是动态的,比如根据日期,每天生成一个文件夹。这样就要kettle导入的文件路径是个变量。最好定义到数据库中。
我的这个例子就是从数据库读取文件路径,文本文件的路径使用变量:
下边是一些截图。代码可以下载
(1)
(2)
(3)
Kettle学习资料分享,附大神用Kettle的一套流程完成对整个数据库迁移方法
Kettle学习资料分享
Kettle 3.2 使用说明书
目录
概述..........................................................................................................................................7
1.Kettle 资源库管理.... ...
kettle数据库同步中文乱码
问题
目标库的表中的中文出现乱码
场景数据库:MySql
源库:UTF-8编码
目标库:UTF8编码
数据库所在的操作系统:Linux
kettle版本:4.4
启动方式:Spoon
运行方式:转换
流程:【表输入】->【表输出】
kettle所在的操作系统:WIN7
解决方案
在数据库连接的【Options】选项卡中增加characterEncoding属性,值为U ...
ubuntu server下python脚本迁移数据
因为是在Ubuntu下,所以安装python、pip、pymysql等都极其方便,sudo apt-get install pymysql,
但是在安装cx_Oracle(连接oracle的模块)出现许多问题,查阅相关资料,发现这边文章能够帮我解决,希望大家少走点弯路。http://www.tbdazhe.com/archives/602
1.安装python
2.安装pip、pymysq ...
kettle
private static void getSubDir(RepositoryDirectoryInterface rootDir,List dataList)
{
Map map=new HashMap();
map.put("id", rootDir.getName());
map.put("text", rootDir.ge ...
Kettle循环调用的实现
今天来和大家讲一下Kettle的一些基础应用,本文包括如何将转换中的结果转出到作业中;转换如何从父作业中获取上一个转换写入的数据;以及设置变量和获取变量的用法。不多说先看最终的作业和转换。
作业:
转换1:
转换3:
这里先说一下思路,在Mysql数据库中保存了一些数据,第一个转换从数据库读取数据并把一些参数设置到环境变量中,第二个转换读取第一个转换获取 ...
10倍以上提高Pentaho Kettle的MySQL写入速度
使用Pentaho Kettle做了个数据抓取入库的程序,大致这个样:
使用文本调测的时候,速度大概7500条/秒,但是换上数据库后,速度只有150条/秒,对于20万左右的数据入库要超过20分钟,这让人没法接受。
使用批量插入好像也没什么效果,依然慢
求助Google,找到了2个参考:
参考1:http://julienhofstede.blogspot.nl ...
used defined java class左侧栏添加自定义方法
在used defined java class左侧栏有很多方法,我们也可以把经常用到的一些方法添加进去,步骤如下
1. 在配置文件中添加自定义方法分类
在org-pentaho.di.trans.steps.userdefinedjavaclass.messages的messages_en_US.properties添加以下代码
# 添加"自定义方法"
UserDefi ...
关于kettle的Block this step until steps finish插件
kettle的【Flow】下有个【Block this step until steps finish】插件,用于阻塞。就是在【Block this step until steps finish】里面写的步骤完成时,【Block this step until steps finish】后的步骤不会开始运行。
但是需要注意的是,假如【Block this step until steps fini ...