本月博客排行
-
第1名
龙儿筝 -
第2名
johnsmith9th -
第3名
wy_19921005 - zysnba
- sgqt
- lemonhandsome
- sichunli_030
年度博客排行
-
第1名
宏天软件 -
第2名
青否云后端云 -
第3名
龙儿筝 - gashero
- wallimn
- vipbooks
- benladeng5225
- wy_19921005
- fantaxy025025
- e_e
- zysnba
- ssydxa219
- sam123456gz
- javashop
- arpenker
- tanling8334
- kaizi1992
- xpenxpen
- wiseboyloves
- xiangjie88
- ranbuijj
- ganxueyun
- sichunli_030
- xyuma
- wangchen.ily
- jh108020
- lemonhandsome
- zxq_2017
- jbosscn
- johnsmith9th
- Xeden
- luxurioust
- lzyfn123
- zhanjia
- forestqqqq
- ajinn
- nychen2000
- wjianwei666
- hanbaohong
- daizj
- 喧嚣求静
- silverend
- mwhgJava
- kingwell.leng
- lchb139128
- lich0079
- kristy_yy
- jveqi
- java-007
- sunj
最新文章列表
批量作业调度、数据挖掘,这几款应该是今年 “最值得推荐” 的ETL工具了
工具传送门:
Taskctl商业付费版(付费)
Taskctl Web商业免费版(永久免费)
Kettle(开源免费)
Datastage (付费)
ETL是数据仓库中的非常重要的一环,是承前启后的必要的一步。ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础 ...
批量kettle作业调度工具 Taskctl 调度任务监控视图
软件安装: 去公众号 "taskctl" 回复内容 "软件" 或 "领取" 即可;
TASKCTL 在线应用简介:
Taskctl在线应用版V1.2相比C/S应用端功能完整,并精简部分操作逻辑,适合初学者体验 taskctl 产品,也能作为中小项目生产应用。
实时监控 Monitor
监控概况
6款ETL国内外主流的调度工具综合对比
工具下载: 去公众号 "taskctl" 回复内容 "领取" 或 "软件" 即可
介绍:
ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成, 最后加载到数据仓库或数据集市中,成为联机分析处理、 数据挖掘的基础。 ETL是数据仓库中的非常重要的一环。
开源etl调度工具Taskctl—web应用版永久授权
初识Taskctl-Web版
Taskctl Free应用版原型是在原有商用版Taskctl 6.0衍生扩展开发出的专门为批量作业调度自动化打造的一款轻便型敏捷调度工具。可为批量作业自动化调度者提供简单的方法来管理各类复杂作业的调度和监控管理。
Taskctl通过将企业内部复杂的作业调度依赖关系,进行灵活的统一编排和管理,带来前所未有的简单性。Taskctl采用全内存计算,基于全事件技术 ...
ETL字符串长度判断并截取
${fn:substring(wjcd.lrsj, 0, 16)}
使用functions函数来获取list的长度
${fn:length(list)}
<c:if test="${fn:length(character) > 19 }">
</c:if>
<%@taglib prefix="c" uri= ...
kettle插件开发,json转string 格式
基于kettle版本5.4.0.1-130
1:实现类
2:JSONToStringMeta
说明:配置标签@Step(),初始化程序
extends BaseStepMeta :继承BaseStepMeta
implements StepMetaInterface :实现接口StepMetaInterface
整个代码的执行过程是:先运行配置标签meta类型,通过meta类找到Dialog类 ...
大数据计算前数据抽取(ETL)概述
ETL,Extraction-Transformation-Loading的缩写,即数据抽取(Extract)、转换(Transform)、装载(Load)的过程,它是构建数据仓库的重要环节。
ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节。通常情况下 ...
开源ETL工具kettle--数据迁移
背景
由于项目的需求,需要将数据从Oracle迁移到MSSQL,不是简单的数据复制,而是表结构和字段名都不一样,甚至需要处理编码规范不一致的情况,如下图所示
注意:Oracle和MSSQL中的同名表的字段名是不相同的
如果要是采用手工SQL语句操作的话会很麻烦,需要考虑
Oracle和MSSQL SQL语法的差异数据从抓取--转化--加载迁移的过程安排字段的映射外键的约 ...
常用的ETL工具
数据的迁移和集成都需要ETL来实现,一般来说在数据仓库的开发过程中ETL会占到70%到80%的时间,下面介绍几种常用的ETL工具(1)Kattle是一个开源的ETL工具,有点免费,适合预算比较少的企业来用,确定不稳定,可维护行比较差(2)DataStage,这是IBM为其配套的DB2开发的ETL工具,也可以用于其它数据库数据的集成,这个工具不错,银行用的挺多的,不过我用不惯这个。(3)Informa ...
ETL
ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
信息是现代企业的重要资源 ...
ETL学习笔记之二 实现篇(转)
实现ETL过程,一般可以从以下四个方面考虑: (一)、准备区的运用(ODS) 在构建数据仓库时,如果数据源位于一台服务器上,数据仓库在另一台服务器端,考虑到数据源Server端访问频繁,并且数据量大,需要不断更新,所以可以建立准备区数据库(ODS)。先将数据抽取到准备区中,然后基于准备区中的数据进行处理,这样处理的好处是防止了在原OLTP系统中频繁访问,进行数据运算或聚合等操作。如果系统中存在多种不 ...
ETL学习笔记之一 概念篇(转)
ETL,Extraction-Transformation-Loading的缩写,即数据抽取(Extract)、转换(Transform)、装载(Load)的过程,它是构建数据仓库的重要环节。 ETL是将业 ...