最新文章列表

kettle4.2 java调用transaction

  KettleEnvironment.init(); TransMeta transMeta = new TransMeta(filename); Trans trans = new Trans(transMeta); trans.prepareExecution(null); trans.startThreads(); trans.waitUntilFinish ...
guooo 评论(0) 有1485人浏览 2012-02-10 09:38

在应用程序中集成kettle

  设计好transformation和job后,如何在java里面调用执行呢?   首先,需要在项目中引入执行kettle所需要的jar包:     除了系统jre之外,以上红色标记的外部jar包(可以在kettle对应的目录下找到)都是必须引入的资源,否则,程序不能正常运行;我自己的做的例子中需要写xls文件,所以用到了jxl.jar。   另外,将kettle目录下plu ...
guooo 评论(0) 有2167人浏览 2012-02-09 16:53

kettle 3:java调用job

  /** * 调用本地job * * @param jobFileName * job文件路径 * @throws KettleException */ public void callNativeJob(String jobFileName) throws KettleException { // 初始化 Env ...
guooo 评论(2) 有2877人浏览 2012-02-09 16:44

kettle 3:java调用transformation

  /** * 调用资源库中的trans * * @throws KettleException */ public void executeTrans() throws KettleException { // 初始化 EnvUtil.environmentInit(); StepLoader.init(); // 日志 LogWr ...
guooo 评论(0) 有1504人浏览 2012-02-09 16:43

java 调用kettle4 的transaction和job

  项目中要用到用Java代码调用Kettle脚本,于是找kettle官方资料,用他们提供的jar包,通过java代码来运行kettle脚本。发现官方提供的实例都只能用于kettle3.0版的脚本,4.0的根本不支持。反复搜索,终于在Matt的新书的附件中找到了Kettle 4.0 API的相关资料,该地址是:ftp://download:download@mediaftp.wiley.com/ ...
guooo 评论(3) 有12520人浏览 2012-02-09 16:33

海量结构化数据的计算探讨

电信运营商每天需要对生产系统产生的海量数据进行分析,首先要从各远端生产系统提取数据,清洗加工等等(ETL),后续就是数据的运算处理,数据量相当大,每天都是TB级,但主要以结构化数据为主,故对于此类有钱的主必然使用oracle。   据我观察对于数据的处理基本上都是采用存储过程进行处理,举个简单的例子,抽取用户的3个月消费数据进行一些类似平均本地通话时长,平均本地通话费用...等等诸如此类的 ...
shaomeng95 评论(1) 有1337人浏览 2011-12-20 17:00

信息交换总线平台IEB

2.产品介绍 2.1 产品简介     信息交换总线平台产品是构建在企业服务总线ESB平台基础上,能够让用户在简单的配置下就轻松实现信息传输、抽 ...
redleaf2011 评论(1) 有1644人浏览 2011-11-18 15:25

etl kettle plugin 实例

自己开发之前看过了网络上很多文章,大多文章简单直接翻译官网或转载,不适合初学者参考。现自己已经开发成功,将个人对程序的理解贴出给大家做个参考。 有图有真相,程序结构先看图: Step            类实际要执行的业务逻辑,真对到行级的操作实现processRow方法。 StepData     数据流操作类,可以调用前一步的数据,再把它输出的下一步。 StepMeta     资源调 ...
唾沫星冲锋枪 评论(0) 有2312人浏览 2011-09-30 13:45

需要了解etl、oscache用法

需要了解etl、oscache用法,先做个记号~
etl 
pythondebug 评论(0) 有1006人浏览 2011-09-27 09:11

Informatica数据加载机制

  很长一段时间,对informatica的数据加载方式,比较迷惑,只是大致知道怎么去使用,直到现在的工作环境中,看到有人在使用Update Strategy这个组件,目 ...
yinwxiang 评论(0) 有4404人浏览 2011-09-22 16:52

Informatica PowerCenter 9终于提供公开下载了

在等待了2年之后,oracle官网上终于提供了Informatica PowerCenter 9的下载,激动,晚上回家下载试用以下。   Informatica PowerCenter 是我认为最好的商业ETL工具,功能强大,性能很高!
nextw3 评论(4) 有3926人浏览 2011-08-26 09:02

oracle expdp 备份 多表 加条件

一般来说,expdp备份的步骤如下: 注:数据泵只能在oracle服务端使用,此处可以备份多个加条件的表 1、创建DIRECTORY create directory etl_dump as 'D:\oracle\dir_dp'; 2、授权 Grant read,write on directory etl_dump to etl_qy; 3、备份 expdp scott/tiger@orcl d ...
my_ora 评论(0) 有4645人浏览 2011-07-26 20:40

最近博客热门TAG

Java(141747) C(73651) C++(68608) SQL(64571) C#(59609) XML(59133) HTML(59043) JavaScript(54918) .net(54785) Web(54513) 工作(54116) Linux(50906) Oracle(49876) 应用服务器(43288) Spring(40812) 编程(39454) Windows(39381) JSP(37542) MySQL(37268) 数据结构(36423)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics