Informatica 找出性能瓶颈

yinwxiang

浏览: 65787 次
性别:
来自: 上海

最近访客更多访客>>

风中的一匹狼tb

AnonymMan

yxwdsq

hankuksui

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Informatica cache session sesslogs Informatica 优化

以下提到的Session log，是指在这个$PMRootDir/SessLogs目录下对应着每个运行的session都有一个以.bin结尾的二进制文件，在查看的时候用strings这个命令
用线程统计定位瓶颈：默认情况下infa会分配：一个read线程，一个transformation线程，一个write线程，来处理一个session，这些都可以在Session log中查看：
    run time：线程运行时间
    Idle time：线程空闲时间
    Busy time: 线程忙的时间（是个比列）
    Thread work time：处理某个transformation用的百分比。
排除基于线程的瓶颈：1.在read和write 线程中busy占的时间比较高时，可用string这种数据类型来对源和目标进行处理，因为处理非string时需要更多的时间。2.在transformation线程busy占的时间比较高时，可用增加partition point来进行处理，当你每增加一个partition，会多分配一个transformation线程来处理数据（这也要考虑系统的环境）。3.当某个transformation组件的处理时间超过其它的组件很多的处理时间时，可以考虑增加partition来对其进行处理。
很悲剧的是，我在8.5.1里面好像没能准确到某个transformation组件，找不到breakdown的等信息？
写数目标瓶颈:通常造成写数目标瓶颈有都是写入数据库：小的checkpiont间隔，小数据库网络包，系统负载过重。找出写瓶颈：可以把目标直接设成写文件模式，这时要是速度快很多，表明是有写数据瓶颈，可以查看session log如果write 时间明显超过转换或读的时间，也表明有。大致的解决思路，DBA帮你优化数据库，数据库查询，增加网络包大小，建立索引，和主键等。
读源数据瓶颈：主要有低效的查询，数据网络数据包配置的较小
找出读瓶颈：可以查看session log如果read时间明显超过转换或写的时间，也表明有该瓶颈。用Filter transformation查出，在这个组件中把condition直接设为false假如速度还是很慢，说明read有瓶颈。去掉其它多余的组件直接写入文本中，看速度如何。还是较慢，说明有问题。直接在log文件中把生成的sql代码放到数据库中执行，看速度如何解决办法：假如是从数据文件中读取，调整每行的字节数对数据库进行优化，增加数据库的网络包大小，建立索引，和主键，还可以告诉数据库sql的按照自己执行计划等。
Mapping瓶颈：当transformation线程这个线程明显高于读，写线程的时间时，或者在某一个transformation组件上花费了较多时间时，瓶颈极有可能是在transformation线程上查看session log 分析性能计数器。errorrows rowsinlookupcache计数器显示很高，也表明是这个瓶颈。还可以这样，直接在写入时加上一个filter，条件为false，看比原先的执行速度没有明显的提高说明存在这个瓶颈。
Session瓶颈：这个主要是监控session log文件中的信息，主要监控input rows, output rows, and error rows这些数据。
系统瓶颈：infa在执行Aggregator, Joiner, Lookup, Sorter, XML, and Rank这些组件时，这些在系统分配的时候同样在Session log里面都有了详细的记录，都是要利用系统空间来创建cache文件的，当然cpu Memory usage，Swap usage.磁盘的占用空间都是要实时进行监控的。

1
顶

0
踩

分享到：

Informatica aix服务端，windows客户端安 ... | Informatica 运用Debug调试

2011-10-18 14:46
浏览 2149
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

informatica 性能调优: 可以采用二分法或排除法找出性能瓶颈。通常，分析Transformation之间的数据流和计算密集度有助于定位问题。 3. **系统性能平衡**： - 性能优化不仅限于Informatica本身，还包括与之交互的数据库和硬件资源。理想...

informatica调优要点(全): 7. **数据流分析**：使用Informatica的Data Profiling功能，对数据进行分析，了解数据质量，找出潜在的性能问题。 8. **版本控制与维护**：保持映射和工作流的整洁，定期进行代码审查，避免因版本混乱导致的性能...

Informatica 运用Debug调试: 3. **问题诊断**：如果在调试过程中发现数据不正确或转换错误，可以通过查看错误日志、数据预览和变量值来找出问题原因。 ### 四、Debug调试技巧 1. **有策略地设置断点**：根据问题定位的需求，合理设置断点，如...

Informatica_Data_Warehouse_Advisor：监控数据使用以实现更好的数据仓库管理: 4. **BI用户活动和查询性能监控**：Data Warehouse Advisor监测用户查询行为，找出拖慢系统性能的查询。这有助于IT团队优化查询性能，防止性能瓶颈，确保BI系统响应迅速。 5. **敏感数据保护**：Data Warehouse ...

轴类零件加工工艺设计.zip: 轴类零件加工工艺设计.zip

《基于YOLOv8的冷链车车门未关严预警系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

seaborn基本绘图人力资源数据集: seaborn基本绘图人力资源数据集

移动机器人(sw三维）.rar: 移动机器人(sw三维）

自制html网页源代码查看器: 自制html网页源代码查看器

3吨叉车的液压系统设计().zip: 3吨叉车的液压系统设计().zip

1_实验三扰码、卷积编码及交织.ppt: 1_实验三扰码、卷积编码及交织.ppt

北京交通大学软件学院自命题科目考试大纲.pdf: 北京交通大学软件学院自命题科目考试大纲.pdf

雅鲁藏布江流域 shp矢量数据 (范围＋DEM).zip: 雅鲁藏布江流域 shp矢量数据 (范围＋DEM).zip

基于RUST的数据结构代码示例，栈、队列、图等: 基于RUST的数据结构代码示例，栈、队列、图等

NIFD：2024Q1房地产金融报告.pdf: NIFD：2024Q1房地产金融报告

工具变量-上市公司核心名称数据集合.xlsx: 详细介绍及样例数据：https://blog.csdn.net/li514006030/article/details/146916652

【工业机器视觉定位软件Vision-Detect】基于C#的WPF与Halcon开发的工业机器视觉定位软件（整套源码），开箱即用: 【工业机器视觉定位软件Vision-Detect】基于C#的WPF与Halcon开发的工业机器视觉定位软件（整套源码），开箱即用有用户登录，图片加载，模板创建，通讯工具，抓边抓圆，良率统计，LOG日志，异常管理，九点标定和流程加载保存等模块，功能不是很完善，适合初学者参考学习。资源介绍请查阅：https://blog.csdn.net/m0_37302966/article/details/146912206 更多视觉框架资源：https://blog.csdn.net/m0_37302966/article/details/146583453

【Java技术领域】Java虚拟机（JVM）面试题详解：涵盖内存模型、垃圾回收、类加载及调优技术（51道含答案）: 内容概要：本文档详细介绍了Java虚拟机（JVM）的相关知识点，涵盖Java内存模型、垃圾回收机制及算法、垃圾收集器、内存分配策略、虚拟机类加载机制和JVM调优等内容。首先阐述了Java代码的编译和运行过程，以及JVM的基本组成部分及其运行流程。接着深入探讨了JVM的各个运行时数据区，如程序计数器、Java虚拟机栈、本地方法栈、Java堆、方法区等的作用和特点。随后，文档详细解析了垃圾回收机制，包括GC的概念、工作原理、优点和缺点，并介绍了几种常见的垃圾回收算法。此外，文档还讲解了JVM的分代收集策略，新生代和老年代的区别，以及不同垃圾收集器的工作方式。最后，文档介绍了类加载机制、JVM调优的方法和工具，以及常用的JVM调优参数。适合人群：具备一定Java编程基础的研发人员，尤其是希望深入了解JVM内部机制、优化程序性能的技术人员。使用场景及目标：①帮助开发人员理解Java代码的编译和执行过程；②掌握JVM内存管理机制，包括内存分配、垃圾回收等；③熟悉类加载机制，了解类加载器的工作原理；④学会使用JVM调优工具，掌握常用调优参数，提升应用程序性能。其他说明：本文档内容详尽，适合用作面试准备材料和技术学习资料，有助于提高开发人员对JVM的理解和应用能力。

基于Android的美食推荐 APP LW PPT.zip: Android项目原生java语言课程设计，包含LW+ppt

戴德梁行&中国房地产协会：2021亚洲房地产投资信托基金研究报告.pdf: 戴德梁行&中国房地产协会：2021亚洲房地产投资信托基金研究报告

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论