用Kettle的一套流程完成对整个数据库迁移 -

ainidehsj

浏览: 136785 次
性别:
来自: 长沙

最近访客更多访客>>

多弗大人

zhjyiqing

zx1441850818

cy1331250

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

用Kettle的一套流程完成对整个数据库迁移

博客分类：

KETTLE
数据交换
KETTLE

kettle

需求：
1.你是否遇到了需要将mysql数据库中的所有表与数据迁移到Oracle。
2.你是否还在使用kettle重复的画着：表输入-表输出、创建表，而烦恼。

下面为你实现了一套通用的数据库迁移流程。

技术引导：
实现之初，在kettle提供的例子中找到了一个类似的（samples\jobs\process all tables）。
通过相关改造，终于达到目标。

实现过程解剖：
整套流程分为：2个job，4个trans。
使用到的Trans插件：表输入、字段选择、复制记录到结果、从结果获取记录、设置变量、自定义java脚本、表输出。
1.大job。

2.要迁移的源库表名称获取，并设置到结果集，为下面的job使用。

3.配置子job为前面的每一条记录（即每个表）执行一次该子job

4.下面是子job。

5.获取记录中的表名称，并设置为到变量。

6.读取当前表的结果信息，并在目标库中创建表（这个是难点）。

因为只需要获取抓取要抽取表的结构信息，故在sql后面加上 where 1=2。

下面代码是创建目标库表。

public boolean processRow(StepMetaInterface smi, StepDataInterface sdi) throws KettleException
{
    // First, get a row from the default input hop
	//
	Object[] r = getRow();

	org.pentaho.di.core.database.DatabaseMeta dbmeta = null;
	
	java.util.List list = getTrans().getRepository().readDatabases();//3.x中获取资源库的所有数据库连接信息用getDatabases();
	
	if(list != null && !list.isEmpty())
	{
		for(int i=0;i<list.size();i++)
		{
			dbmeta = (org.pentaho.di.core.database.DatabaseMeta)list.get(i);
                        //下面是目标库的数据库连接，大家可根据需要修改
			if("mysql_test".equalsIgnoreCase(dbmeta.getName()))
			{				
				break;
			}
		}
	}

	if(dbmeta!=null)
	{
		org.pentaho.di.core.database.Database db=new org.pentaho.di.core.database.Database(dbmeta);
		
		try
		{
			db.connect();

			String tablename = getVariable("TABLENAME");

			logBasic("开始创建表：" + tablename);
			
			if(tablename!=null && tablename.trim().length()>0)
			{
				String sql = db.getDDL(tablename, data.inputRowMeta);//${TABLENAME}
							
				db.execStatement(sql.replace(";", ""));

				logBasic(sql);
			}
		}
		catch(Exception e)
		{			
			logError("创建表出现异常",e);
			
		}finally{
			db.disconnect();
		}
	}
	return false;
}

7.表数据迁移。

8.差不多就行了，本人使用mysql到mysql、oracle的测试是没有问题的不过在测试过程中，发现源表若存在有blob的表，会有问题，可能是由于表输出没有指定字段的原因，具体解决办法，也没有去多想，以后有时间在完善把。

上面的整套流程的是在kettle4.3下完成的，附件里面可下载完整流程。

5.x运行到创建表结构步骤报错，原因data.inputRowMeta为空，因为在第6步
在sql后面加上 where 1=2，导致表输入步骤没有抽取到记录，5.x里结构也变成了null。
解决：
把where 1=2去掉，然后，在表输入的限制行设置为1，即可，本人亲测。

数据库迁移示例.rar (14.6 KB)
下载次数: 2395

分享到：

kettle实现主从表增量迁移示例 | Kettle模版文件简单使用示例

2012-11-26 16:51
浏览 91258
评论(22)
分类:开源软件
查看更多

22 楼 skying007 2017-07-18

好文章！

21 楼 sunggff 2017-04-12

亲，在迁移空表时出现空指针异常的具体解决办法是怎样的，求解答

20 楼 soft_xiang 2017-04-10

你好，用的kettle 7.0 在执行的时候，创建表的那句出错

java.util.List list = getTrans().getRepository().readDatabases();
这句里面
getTrans().getRepository()
这个返回了Null

会是什么问题呢？

19 楼 xueyubingsen 2017-01-11

环境：kettle 6.0 +源和目标都是mysql
报错如下，timestamp数据类型不知道为什么识别成了unknown。。。，改成date类型就好了
2017/01/11 10:45:20 - Java 代码.0 - 开始创建表：msg_log_old
2017/01/11 10:45:20 - Java 代码.0 - CREATE TABLE msg_log_old
2017/01/11 10:45:20 - Java 代码.0 - (
2017/01/11 10:45:20 - Java 代码.0 - id INT
2017/01/11 10:45:20 - Java 代码.0 - , name TINYTEXT
2017/01/11 10:45:20 - Java 代码.0 - , birthday UNKNOWN
2017/01/11 10:45:20 - Java 代码.0 - )
2017/01/11 10:45:20 - Java 代码.0 - ;
2017/01/11 10:45:20 - Java 代码.0 - ERROR (version 6.0.1.0-386, build 1 from 2015-12-03 11.37.25 by buildguy) : 创建表出现异常
2017/01/11 10:45:20 - Java 代码.0 - ERROR (version 6.0.1.0-386, build 1 from 2015-12-03 11.37.25 by buildguy) : org.pentaho.di.core.exception.KettleDatabaseException:
2017/01/11 10:45:20 - Java 代码.0 - Couldn't execute SQL: CREATE TABLE msg_log_old
2017/01/11 10:45:20 - Java 代码.0 - (
2017/01/11 10:45:20 - Java 代码.0 - id INT
2017/01/11 10:45:20 - Java 代码.0 - , name TINYTEXT
2017/01/11 10:45:20 - Java 代码.0 - , birthday UNKNOWN
2017/01/11 10:45:20 - Java 代码.0 - )
2017/01/11 10:45:20 - Java 代码.0 -
2017/01/11 10:45:20 - Java 代码.0 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'UNKNOWN
2017/01/11 10:45:20 - Java 代码.0 - )' at line 5
2017/01/11 10:45:20 - Java 代码.0 -
2017/01/11 10:45:20 - Java 代码.0 - at org.pentaho.di.core.database.Database.execStatement(Database.java:1506)
2017/01/11 10:45:20 - Java 代码.0 - at org.pentaho.di.core.database.Database.execStatement(Database.java:1454)
2017/01/11 10:45:20 - Java 代码.0 - at Processor.processRow(Processor.java:41)
2017/01/11 10:45:20 - Java 代码.0 - at org.pentaho.di.trans.steps.userdefinedjavaclass.UserDefinedJavaClass.processRow(UserDefinedJavaClass.java:1018)
2017/01/11 10:45:20 - Java 代码.0 - at org.pentaho.di.trans.step.RunThread.run(RunThread.java:62)
2017/01/11 10:45:20 - Java 代码.0 - at java.lang.Thread.run(Thread.java:745)
2017/01/11 10:45:20 - Java 代码.0 - Caused by: com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'UNKNOWN
2017/01/11 10:45:20 - Java 代码.0 - )' at line 5

18 楼 yilijun246437 2016-11-25

java3344520 写道

环境：kettle 6.0 +源和目标都是mysql，
用样例无法运行，改写java代码控件的脚本可以执行成功，但是字段类型不能和源库一样

改写哪个控件？JAVA里面我没改成功。

17 楼 yelangshisan 2016-10-26

大哥哥，这套能迁移成功，但是表上面的主键外键，都没添加上如何做可以把主键什么的添加上

16 楼 java3344520 2016-02-22

环境：kettle 6.0 +源和目标都是mysql，
用样例无法运行，改写java代码控件的脚本可以执行成功，但是字段类型不能和源库一样

15 楼 richard_cb 2016-01-05

有人能成功么，我的不行，在第 5 6 步

14 楼 hosper 2015-10-30

建表可以，但创建存储过程不行，kettle里面如何创建存储过程？

13 楼 ainidehsj 2014-10-11

shengsheng215 写道

在第六步的时候报错了呢？2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : Unexpected error
2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : java.lang.NullPointerException
2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : at Processor.processRow(Processor.java:9)
2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : at org.pentaho.di.trans.steps.userdefinedjavaclass.UserDefinedJavaClass.processRow(UserDefinedJavaClass.java:1181)
2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : at org.pentaho.di.trans.step.RunThread.run(RunThread.java:50)
2013/05/22 17:01:14 - User Defined Java Class.0 - ERROR (version 4.3.0-stable, build 16786 from 2012-04-24 14.11.32 by buildguy) : at java.lang.Thread.run(Thread.java:619)
能给看一下吗？谢啦

在新版本中，这个表输入查询不到记录（因为sql有1=2），在第六步的获取表输入输出结构为空！导致了你上面的错误，目前本人没有去研究，建议没有用到新版本功能，还是用4.x较妥。

12 楼马新浪2011 2014-10-10

楼主你好，我用这个脚本做数据库的迁移，现在就是到在目标库建表的时候，“当源数据库的表为空的时候”，直接报错误：创建入库表结构.0 - ERROR (version 5.1.0.0, build 1 from 2014-06-19_19-02-57 by buildguy) : java.lang.NullPointerException

向源数据库的空表里面随便写一条数据，就能够在目标数据库建表。能帮忙看看吗？

11 楼 ainidehsj 2014-05-27

flzhang132 写道

楼主你好，我也是用资源库做的，现在就是到在目标库建表的时候，执行到java程序中取data.inputRowMeta数据总是null，这里面因该是真么数据呀，怎么取出数值呢？

我刚才试了一下5.x里测试这个示例确实出现这个问题。要修改一个地方。

10 楼 flzhang132 2014-05-27

9 楼 feng123 2014-02-26

附件下载，求求

8 楼 liuruming 2013-11-13

创建入库表结构是怎么建立呀？？？

7 楼 ainidehsj 2013-10-24

最近很少上javaeye，有问题上我的kettle群讨论把（227385701）。

6 楼 ainidehsj 2013-10-24

shengsheng215 写道

你用的不是资源库把，所以才会报空指针异常、

5 楼 spp_1987 2013-10-08

眼拙，刚没看见附件

4 楼 spp_1987 2013-10-08

楼主求下载附件。

3 楼 hahalaka 2013-08-09

函数名 getDDL 改为
getDDLCreationTable 即可

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用Kettle的一套流程完成对整个数据库迁移

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

用Kettle的一套流程完成对整个数据库迁移

评论

发表评论

相关推荐

Kettle定时执行应用场景1

kettle实现主从表增量迁移示例

Kettle模版文件简单使用示例

kettle学习示例

Kettle讨论群，欢迎大家进入

最近访客更多访客>>