`
cutesunshineriver
  • 浏览: 198809 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Kettle最佳实践

阅读更多
一、当输入对象为CSV文件时,将NIO Buffer Size从默认的50000改到最佳的200000。

二、当输出对象为表输出时,将提交记录数量从默认的1000改到最佳的4000。

三、尽可能关闭转换过程中一切与数据库相关的日志,如表日志、索引日志等。

四、在数据库去重时,使用普通索引而不是唯一性索引。

五、在插入数据之前,先使索引unusable,数据导完之后再rebuild索引。需要注意的是,像数据库去重这种需要索引来优化查询速度的情况可以排除在外。

六、索引和表数据使用不同的表空间,尽可能的减少IO争用。

七、Kettle所在操作系统优先选择Windows,在有些情况下Linux的插入速度明显偏低。
分享到:
评论
4 楼 datawarehouse 2012-09-03  
cutesunshineriver 写道
datawarehouse 写道
博主也用过kettle啊?

现在也还在用呢。

我是用过2年+,现在没在用了。
之前一直用的3.2的版本。
3 楼 cutesunshineriver 2012-08-31  
datawarehouse 写道
博主也用过kettle啊?

现在也还在用呢。
2 楼 datawarehouse 2012-08-31  
博主也用过kettle啊?
1 楼 guooo 2012-06-26  

相关推荐

    PDI Kettle 最佳实践

    PDI Kettle 最佳实践是对Pentaho Data Integration(PDI)中Kettle工具应用的高级指导,旨在帮助用户更高效地完成ETL(提取、转换和加载)任务。PDI Kettle是Pentaho套件中用于ETL的组件,广泛应用于数据整合、数据...

    ETL工具KETTLE实例手册

    ### 三、Kettle最佳实践 #### 3.1 性能优化 为了提高ETL作业的性能,Kettle提供了并行执行、缓存机制、集群部署等多种策略。合理设置线程池大小、优化数据流结构、利用缓存减少重复查询等,都是提升效率的有效手段...

    Pentaho Kettle Solutions 中文版文档

    七、Kettle的最佳实践 学习文档中会涵盖如何设计高效的转换,如何优化数据处理性能,以及如何进行错误处理和数据质量检查等最佳实践。理解这些原则可以帮助用户在实际项目中更好地运用Kettle。 综上所述,《Pentaho...

    kettle-manager集成web页面调度

    通过以上步骤和最佳实践,你可以构建一个强大且灵活的数据处理平台,让Kettle的威力更好地服务于你的业务需求。在实际操作中,可能还需要根据具体的技术栈和业务场景进行调整,但核心思想始终是利用Kettle的强大功能...

    kettle学习资料、安装包、视频教程

    此外,视频教程可能还会涵盖最佳实践、性能优化以及与其他系统的集成策略。 在压缩包中的"KettleRep"可能是一个Kettle的Repository(仓库)文件,它存储了Kettle的工作流和转换文件。在Kettle中,Repository用于...

    java集成kettle所有jar包

    Java集成Kettle所有Jar包是一项常见的任务,尤其对于那些在数据处理、ETL(提取、转换、加载)项目中使用Kettle(也称为...在实践中,可能还会遇到特定的问题,如性能调优、并发处理等,这都需要根据具体情况进行解决。

    kettle连接ClickHouse驱动包

    了解ClickHouse的最佳实践和Kettle的工作原理可以帮助你更有效地利用这两个工具。此外,随着Kettle社区的发展,可能会有第三方插件或者更新版本提供对ClickHouse的直接支持,定期检查更新以获取最新功能和改进。 ...

    java调用kettle的依赖包

    6. **最佳实践**: - 将Kettle的配置文件和转换文件存储在版本控制系统中,便于版本管理和团队协作。 - 使用Maven或Gradle等构建工具管理依赖,确保所有必要的库都能正确导入。 - 在生产环境中,考虑使用Kettle的...

    用于kettle连接sap

    标题中的“用于kettle连接sap”表明我们要讨论的是如何使用Kettle(Pentaho Data Integration,简称PDI)...不过,需要注意的是,在实际操作中,还需要遵循SAP的安全策略和最佳实践,确保系统的稳定性和数据的安全性。

    KETTLE5.4中文使用说明文档

    通过学习这份《Kettle 5.4中文使用说明文档》,用户不仅能掌握Kettle的基本用法,还能深入了解其高级特性和最佳实践,从而在实际工作中更好地利用Kettle进行数据处理和ETL流程构建。无论你是初学者还是经验丰富的...

    kettle资料

    9. **最佳实践**:作者可能会分享一些在使用Kettle过程中总结的最佳实践,帮助读者避免常见的陷阱和误区。 10. **社区与扩展**:Kettle拥有活跃的开发者社区,提供了丰富的插件和扩展,使得Kettle的功能可以无限...

    pentaho kettle中文开发手册

    《Pentaho_Technical_Whitepaper_zh_CN.pdf》是一份技术白皮书的中文版,通常会详细介绍Pentaho Kettle的技术架构、核心功能、性能特性以及最佳实践。读者可以通过这份文档深入理解Pentaho Kettle的内部工作机制,...

    etl工具-kettle6.0

    这些功能对于实现数据治理的最佳实践至关重要。 9. **API与集成**:Kettle提供了RESTful API,允许与其他系统(如企业服务总线、自动化工具)集成,实现ETL流程的自动化触发。 10. **数据安全**:Kettle 6.0加强了...

    Kettle8.2入门PPT.rar

    4. **最佳实践**:分享使用Kettle时的技巧和注意事项。 通过这份PPT,新手可以逐步掌握Kettle的基本操作和设计理念,为后续深入学习和实际项目应用打下坚实的基础。同时,建议结合其他在线教程、文档和社区资源,...

    kettle初学者入门视频教程及文档

    **KETTLE文档.pdf**:这是官方或社区编写的Kettle详细指南,包含了Kettle的使用方法、API参考、最佳实践等内容,对于学习和理解Kettle的内部工作原理以及提升工作效率非常有帮助。 4. **多表全量同步**: - **多...

    kettle文档大集合

    3. **最佳实践**:这些文档总结了在实际项目中使用Kettle时的经验和技巧,有助于提升工作效率,避免常见问题。 4. **API参考**:详细列出了Kettle的所有步骤、转换、作业及核心类库,方便开发人员查找和使用API。 ...

    etl工具Kettle大全

    10. **最佳实践**:理解如何编写可维护、可扩展的Job和Transformation,遵循良好的ETL设计原则,如模块化、错误处理机制、数据验证等。 通过深入学习和实践这些知识点,用户不仅可以掌握Kettle的基本操作,还能利用...

    java调用Kettle5.3任务

    以上是关于“Java调用Kettle 5.3任务”的详细阐述,涵盖了Kettle的基本概念、Java API的使用、集成步骤以及最佳实践。通过这种方式,开发者可以构建强大的数据处理流程,同时享受到Java和Kettle两者的优点。

Global site tag (gtag.js) - Google Analytics