本月博客排行
-
第1名
龙儿筝 -
第2名
lerf -
第3名
fantaxy025025 - johnsmith9th
- xiangjie88
- zysnba
年度博客排行
-
第1名
青否云后端云 -
第2名
宏天软件 -
第3名
gashero - wy_19921005
- vipbooks
- benladeng5225
- e_e
- wallimn
- javashop
- ranbuijj
- fantaxy025025
- jickcai
- gengyun12
- zw7534313
- qepwqnp
- 解宜然
- ssydxa219
- zysnba
- sam123456gz
- sichunli_030
- arpenker
- tanling8334
- gaojingsong
- kaizi1992
- xpenxpen
- 龙儿筝
- jh108020
- wiseboyloves
- ganxueyun
- xyuma
- xiangjie88
- wangchen.ily
- Jameslyy
- luxurioust
- lemonhandsome
- mengjichen
- jbosscn
- zxq_2017
- lzyfn123
- nychen2000
- forestqqqq
- wjianwei666
- ajinn
- zhanjia
- Xeden
- hanbaohong
- java-007
- 喧嚣求静
- mwhgJava
- kingwell.leng
最新文章列表
What’s New in Pentaho Data Integration 4.1
Last Modified on October 28, 2010
What’s New in Pentaho Data Integration整合
Enterprise Edition 4.1
Copyright ? 2010 Pentaho Corporation. Redistribution重新分配 permitted. All trademarks商标 are the property所有 ...
ETL工具kettle入门helloworld
kettle官方网站http://kettle.pentaho.com/
先下载压缩包,我这里下载的是4.4版本,大概400M
下载后解压,装JDK,配环境变量
配置完毕后,打开解压后根目录下有Spoon.bat,双击打开
创建资源库,用户名密码都是admin
kettle一共可以创建两种脚本文件,一种是transformation,就是任务,比如抽取数据,合并修改什么的。
另一种是job,就是 ...
Use Quartz to schedule running ETL job
EtlScheduler.java
package com.simonftxy.core;
import static org.quartz.DateBuilder.evenMinuteDate;
import static org.quartz.JobBuilder.newJob;
import static org.quartz.TriggerBuilder.newTrigge ...
数据仓库之 ETL漫谈
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。
大多数据仓库的数据架构可以概括为:
数据源-->ODS(操作型数据存储)-->DW-->DM(data mart)
ETL贯穿其各个环节。
一、数据抽取:
可以理解为是把源数据的数据抽取到ODS或者DW中。
1. ...
Incremental Loading for Fact Tables
METHOD OF LOADING
Generally speaking, incremental loading for Fact tables is relatively
easier as, unlike dimension tables, here you do not need to perform any
look-up on your target table to ...
tOracleRow组件执行多条SQL语句
tOracleRow
组件执行多条SQL语句
1.概述
说明如何在一个
tOracleRow
组件执行多条SQL
语句。
2.技术环境
以下是完成本教程的技术环境。通常情况下,你应该得到同样的结果在其他环境中。如果没有,请迁移到相同的环境,以确保你得到相同的结果:有可能是一个产品缺陷,或在是不可可用功能。
产品版 ...
How to Delete duplicate row using Informatica
How to Delete duplicate row using Informatica
Scenario 1: Duplicate rows are present in relational database
Suppose we have Duplicate records in Source System and we want to
load only the unique re ...
Top 10 things you must know before designing a data warehouse
This paper outlines some of the most important (and equally
neglected) things that one must consider before and during the design
phase of a data warehouse. In our experience, we have seen data
w ...
kettle学习示例
1.从email下载一个EXCEL文件(文件格式:A_YYYYMMDD.xls),装载、转换,把文件改名为B_yyyymmdd.xls(日期要求:源文件上月同期) 发送到指定邮箱
2.A表 10000条数据,拷贝到B表,然后B表随机删1000条数据,找出删除的数据
3.有一个表10000条数据,要删除里面重复的数据,同时保留的那条是最近插入的那条。。。。这个要怎么做.
4.kettle前一个步骤中 ...
一个神奇的ETL工具:CR-X
虽然, 我的SWING和规则引擎技术还没用研究清楚, 但是最近接受到总部的一个任务,要求写一个数据模型规范, 真是一个非常困难的任务, 因为我基本上没用任何数据库设计的背景, 而且我的数学学习的也不好, 但是老板已经接下这个任务,那么我就必须得突破这个难关。好在老板同意申请专项资金,请第三方公司咨询完成。
这个星期就向所有前期联系的IT公司发邮件联系,不过大家一听 ...