`
cutesunshineriver
  • 浏览: 200488 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Kettle笔记

阅读更多
1、Kettle安装在windows xp上的时候,如果调大Xmx到1024M的时候,有时候会无法启动,而win7就不会。32位win7最大能调Xmx至1200M左右。
2、Kettle4.3默认缺少了oracle的jdbc驱动,可以将驱动丢至主目录的libext/JDBC下。
3、Kettle安装后,所带的oracle的jdbc驱动不支持读写字符集为简体中文集的Oracle数据库,可将ojdbc6.jar替换成ojdbc14.jar,之后可读写简体中文Oracle数据库,但是批量提交的数最好是1000,设为2000或4000的时候会报错。
4、Kettle4.1的文件名不支持中文路径。
5、CSV的编码方式,UTF-8还是GBK。
6、CSV文件带不带说明性质的头一行。
7、CSV文件的分隔符是什么,封闭符是什么,在文件导出的时候要考虑替换掉源数据中的封闭符和换行符。
8、字段数据中,考虑要不要进行字典翻译。
9、特殊字符的过滤,比如单引号,如果进入数据库,可能造成SQL出错。
10、字段数据的两端空格是否要过滤。
11、windows和linux的换行符不一样,windows是\r\n,Linux是\n。
12、Kettle的Java控件,只支持jdk1.4的语法,只能调用外部jar包的静态方法。
分享到:
评论

相关推荐

    尚硅谷Kettle笔记

    尚硅谷Kettle笔记

    有道云kettle笔记链接.txt

    根据提供的文件信息,本文将对Kettle与MaxCompute在阿里云环境下的应用进行详细解析,同时结合有道云笔记分享的资源,为读者提供全面的知识梳理。 ### Kettle简介 Kettle是一款开源的数据集成工具,它支持数据抽取...

    kettle笔记.zip

    Kettle,全称为Pentaho Data Integration(PDI),是一款强大的数据集成工具,由社区开源项目Kettle(现为Hitachi Vantara的一部分)开发。Kettle提供了图形化的界面,让用户可以通过拖拽的方式构建ETL(提取、转换...

    kettle学习笔记.docx

    【Kettle学习笔记】 Kettle,也称为Pentaho Data Integration (PDI),是一种强大的数据集成工具,广泛用于ETL(提取、转换、加载)过程,实现数据迁移和整合。Kettle提供了丰富的图形化界面和命令行工具,使得数据...

    BI Kettle中文文档汇集

    BI Kettle中文文档汇集 ELT平台操作手册-KETTLE.pdf ETL工具kettle.pdf etl工具kettle公司学习文档.pdf ETL工具kettle学习总结.pdf ... 我的kettle学习笔记.pdf 测试ETL工具都应测试哪些方面.pdf

    ETL学习笔记 Kettle基本知识交流

    "ETL学习笔记 Kettle基本知识交流" Kettle 是一款国外开源的 ETL 工具,纯 Java 编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员 MATT 希望把...

    kettle4.1学习使用笔记

    NULL 博文链接:https://ghl116.iteye.com/blog/1184028

    ETL学习笔记之Kettle下载与部署与使用

    ### ETL学习笔记之Kettle下载与部署与使用 #### 一、Kettle概念与应用场景 Kettle是一款功能强大的开源ETL(Extract-Transform-Load)工具,它使用纯Java编写,因此可以在多种操作系统上运行,包括Windows、Linux...

    Kettle操作手册入门笔记-20211113

    基于pdi7.1版本的开发笔记(含kettle环境配置、循环实现等)

    kettle思维导图.xmind

    kettle的思维导图,kettle学习中的一些记录,相当于复习笔记!

    kettle学习笔记(一) kettle简介-附件资源

    kettle学习笔记(一) kettle简介-附件资源

    ETL解决方案大PK:Apache NiFi、DataX、Kettle哪个更适合你?

    ### ETL解决方案大PK:Apache NiFi、DataX、Kettle哪个更适合你? #### 引言 随着大数据时代的到来,企业对于数据的处理需求日益增加。为了更好地管理和利用这些数据,ETL(Extract-Transform-Load)作为一种常用...

    Data Integration Kettle 插件 增量数据加载

    阅读这些笔记对于了解插件的最新变化和最佳实践至关重要。 最后,`plugin.xml`是Kettle插件的核心配置文件,它定义了插件的元数据,如名称、版本、依赖项以及插件提供的具体服务。在这个文件中,我们可以找到关于`...

Global site tag (gtag.js) - Google Analytics