`
中华国锋
  • 浏览: 45745 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

sql优化

 
阅读更多

1.问题描述:

ECSS中有一条BI ETLSQL语句(如下),当S_ETL_I_IMG_26表的数据量达到15W, S_ETL_R_IMG_26表有150W后,这条SQL语句将会执行10多个小时.

DELETE  FROM S_ETL_R_IMG_26

WHERE EXISTS

( SELECT 'X'

FROM S_ETL_I_IMG_26

WHERE S_ETL_R_IMG_26.ROW_ID = S_ETL_I_IMG_26.ROW_ID

)

2.问题分析与处理:

经过DBA优化后,这条SQL语句在数据量达到15W以后,执行所花费的时间是在一分钟以下.

以下是DBA的详细分析和优化过程.我们大家可以好好的学习一下.

==2009-6-23 DBA更新

今天上午观察,该sql已经使用上昨天导入的outline,效率很快。该问题解决了。

==2009-6-22 DBA更新

经过2009-6-19 2100 S_ETL_R_IMG_26 exp/imp,重整以后,S_ETL_R_IMG_26目前这个表大小才56M了,缩小为原来的1/10,数据空洞已经消除了。

但是今天生产库上的该sql的执行计划还是没有变,执行效率也没有提高。

进一步分析,把生产库上的S_ETL_I_IMG_26/S_ETL_R_IMG_26两个表的数据导入开发库,在开发库的执行计划是(如下),使用hash join ,效率很快,大概4分钟就完成delete 50w的记录。

开发库执行计划:

SQL> select * from table(dbms_xplan.display);

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

Plan hash value: 1335637332

--------------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes |TempSpc| Cost

--------------------------------------------------------------------------------

| 0 | DELETE STATEMENT | | 475K| 15M| | 475

| 1 | DELETE | S_ETL_R_IMG_26 | | | |

|* 2 | HASH JOIN RIGHT SEMI| | 475K| 15M| 10M| 475

| 3 | INDEX FULL SCAN | S_ETL_I_IMG_26_M2 | 475K| 5576K| |

| 4 | TABLE ACCESS FULL | S_ETL_R_IMG_26 | 1596K| 33M| | 160

--------------------------------------------------------------------------------

生产库执行计划:

SQL> select * from table(dbms_xplan.display_cursor('bs5h9z7kp1qa2', 0));

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

SQL_ID bs5h9z7kp1qa2, child number 0

-------------------------------------

DELETE FROM S_ETL_R_IMG_26 WHERE EXISTS ( SELECT 'X' FROM

S_ETL_I_IMG_26 WHERE S_ETL_R_IMG_26.ROW_ID = S_ETL_I_IMG_26.ROW_ID )

Plan hash value: 2166185037

--------------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU)

--------------------------------------------------------------------------------

| 0 | DELETE STATEMENT | | | | 111 (100)

| 1 | DELETE | S_ETL_R_IMG_26 | | |

| 2 | NESTED LOOPS SEMI | | 475K| 15M| 111 (0)

| 3 | INDEX FULL SCAN | S_ETL_R_IMG_26_M3 | 1596K| 33M| 109 (0)

|* 4 | INDEX FAST FULL SCAN| S_ETL_I_IMG_26_M2 | 141K| 1662K| 0 (0)

--------------------------------------------------------------------------------

于是进一步研究,为何该sql在开发/生产库上的执行计划不一样,发现是生产的参数不同引起。OPTIMIZER_INDEX_COST_ADJ这个参数在生产上为1,开发库为100,意思是在生产库上告诉优化器,使用index的代价为1,而在开发库上告诉优化器,使用index的代价为100,所以优化器在生产库上偏重走index,导致通过index full scannested loop来完成,由于S_ETL_R_IMG_26在生产库上有150万行记录,nestloop需要做150万次以上查询,故执行效率很低。

生产ecss

SQL> show parameter OPTIMIZER_INDEX_COST_ADJ;

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

optimizer_index_cost_adj integer 1

开发ecssint

SQL> show parameter OPTIMIZER_INDEX_COST_ADJ

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

optimizer_index_cost_adj integer 100

===2009-6-19 DBA更新

S_ETL_R_IMG_26这个表应该有很多空间浪费, 因为S_ETL_R_IMG_26 637M 150万条记录),S_ETL_I_IMG_26 9M26万条记录),而两个表结构是一致的,这样估算,S_ETL_R_IMG_26这个表实际最多60M空间就可以了,浪费90%的空间,也有很多数据空洞。

最好作一次expimp,这样可以重建index也可以消除数据空洞。

SQL> select bytes/1024/1024 from dba_segments where segment_name='S_ETL_R_IMG_26';

BYTES/1024/1024

---------------

637

SQL> select bytes/1024/1024 from dba_segments where segment_name='S_ETL_I_IMG_26';

BYTES/1024/1024

---------------

9

SQL> select count(*) from siebel.S_ETL_R_IMG_26;

COUNT(*)

----------

1584586

SQL> select count(*) from siebel.S_ETL_I_IMG_26;

COUNT(*)

----------

266396

SQL>

SQL> desc siebel.S_ETL_I_IMG_26

Name Type Nullable Default Comments

---------------- ----------------- -------- ------- --------

ROW_ID VARCHAR2(15 CHAR)

LAST_UPD DATE sysdate

MODIFICATION_NUM NUMBER(10)

OPERATION VARCHAR2(1 CHAR)

SQL> desc siebel.S_ETL_R_IMG_26

Name Type Nullable Default Comments

---------------- ----------------- -------- ------- --------

ROW_ID VARCHAR2(15 CHAR)

LAST_UPD DATE sysdate

MODIFICATION_NUM NUMBER(10)

SQL>

对于这个参数OPTIMIZER_INDEX_COST_ADJgoogle查了一个.

OPTIMIZER_INDEX_COST_ADJ

这个初始化参数代表一个百分比,取值范围在110000之间.该参数表示索引扫描和全表扫描成本的比较。缺省值100表示索引扫描成本等价转换与全表扫描成本。

这些参数对于CBO的执行具有重大影响,其缺省值对于数据库来说通常需要调整。一般来说对于OPTIMIZER_INDEX_CACHING可以设置为90左右。

对于大多数OLTP系统,OPTIMIZER_INDEX_COST_ADJ可以设置在1050之间。对于数据仓库和DSS系统,可能不能简单的把OPTIMIZER_INDEX_COST_ADJ设置为50

通常我们需要反复调整取得一个合理值。更为具体的可以根据统计信息,db file scattered reads/db file sequential reads来计算.

这个参数当时是Oracle 的优化工程师过来调整为1的.调整1表示使用索引的Cost是全表扫描的Cost 1%才使用索引.

在生产环境上调整这个参数得再认真观察和评审.

这条SQL语句的优化已经不是我们增加索引所能解决的了,跟数据库的参数有非常大的关系.

分享到:
评论

相关推荐

    SQL优化 SQL优化软件 SQL优化工具

    SQL优化是数据库管理中的关键环节,它涉及到提升查询性能、减少资源消耗以及改善系统整体效率。SQL优化软件和工具能够帮助数据库管理员(DBA)和开发人员找出性能瓶颈,优化查询逻辑,从而提高数据库系统的响应速度...

    基于案例学习SQL优化

    在“基于案例学习SQL优化”的课程中,我们主要探讨如何提升数据库性能,特别是针对SQL查询的优化技巧。DBA(数据库管理员)作为关键角色,需要掌握这些技能来确保系统的高效运行。以下是根据课程标题和描述提炼出的...

    收获,不止SQL优化--抓住SQL的本质1

    - **全书总结**:本书不仅是一本关于SQL优化的技术书籍,更是引导读者进入SQL优化世界的指南。通过丰富的案例、实战经验和深入的技术探讨,帮助读者建立起从宏观到微观的优化思路,并最终达到“爽”的境界。 - **...

    收获不止SQL优化

    第2章 风驰电掣——有效缩短SQL优化过程 24 2.1 SQL调优时间都去哪儿了 25 2.1.1 不善于批处理频频忙交互 25 2.1.2 无法抓住主要矛盾瞎折腾 25 2.1.3 未能明确需求目标白费劲 26 2.1.4 没有分析操作难度乱调优...

    mysql数据库sql优化

    ### MySQL数据库SQL优化 #### 一、SQL优化 在MySQL数据库管理中,SQL查询的性能直接影响到系统的响应时间和资源消耗。通过合理的SQL优化,可以显著提高数据处理速度,降低服务器负载,提升用户体验。 ##### 1.1 ...

    《基于Oracle的SQL优化》PDF版本下载.txt

    根据提供的文件信息,本文将对《基于Oracle的SQL优化》这一主题进行深入解析,包括但不限于SQL优化的重要性、Oracle数据库的特点以及具体的SQL优化方法等。 ### SQL优化的重要性 SQL(Structured Query Language)...

    基于案例学SQL优化

    本主题"基于案例学SQL优化"将深入探讨如何通过实际案例来理解和实践SQL优化的策略和技术。 首先,我们要明确SQL优化的重要性。当数据库规模增大,查询复杂度增加时,未优化的SQL语句可能导致响应时间过长,影响用户...

    收获,不止SQL优化 PDF 带书签 第三部分

    随后《收获,不止SQL优化——抓住SQL的本质》指引大家学会等价改写、过程包优化、高级SQL、分析函数、需求优化这些相关的五大神功。有点头晕,能否少一点套路?淡定,这还是“术”的范畴,依然是教你如何解决问题,...

    Oracle_SQL优化脚本_完整实用资源

    Oracle SQL优化是数据库管理员和开发人员提升系统性能的关键技能之一。这个"Oracle_SQL优化脚本_完整实用资源"压缩包包含了一系列工具和方法,旨在帮助你优化在Oracle数据库上运行的SQL查询,从而提高数据库的响应...

    sql优化书籍大全

    本书籍集合了丰富的SQL优化知识,旨在帮助读者深入理解并掌握MySQL SQL优化技巧。 首先,我们要明白SQL优化的基本原则:减少查询次数、减小数据量、合理设计索引以及优化查询语句结构。这四个原则贯穿于整个SQL优化...

    《收获,不止SQL优化》一书的代码

    《收获,不止SQL优化》是一本专注于数据库性能优化的书籍,尤其关注Oracle数据库系统的SQL调优。这本书通过实例和深入的解析,帮助读者理解和掌握如何提升SQL查询的效率,从而优化整个数据库系统的性能。在阅读这...

    Oracle 高性能SQL引擎剖析SQL优化与调优机制详解

    深入揭示OracleSQL优化与调优的原理、核心技术与思想方法 盖国强鼎力推荐! Oracle数据库的性能优化直接关系到系统的运行效率,而影响数据库性能的一个重要因素就是SQL性能问题。本书是作者十年磨一剑的成果之一...

    基于Oracle的SQL优化2

    基于Oracle的SQL优化

    【整理】数据库面试题索引sql优化+数据库SQL优化总结之百万级数据库优化

    本文将深入探讨数据库面试中的常见问题,特别是关于SQL优化和针对大规模数据库的优化策略。首先,我们来看看"数据库面试题索引sql优化.pdf"可能涵盖的内容。 1. **SQL基础与语法**:面试通常会涉及到SQL的基本概念...

    基于SQL Server的SQL优化.pdf

    在SQL Server数据库管理系统中,SQL优化是提升系统性能的关键环节。SQL优化涉及到多个层面,包括查询设计、索引策略、存储过程优化、执行计划分析以及资源管理等。本篇文章将深入探讨这些方面,帮助读者理解如何针对...

    大道相通,得鱼忘筌 - 从Oracle的SQL优化到MySQL的SQL优化.pdf

    在数据库管理与优化领域,SQL优化是至关重要的一环,它涉及到数据库性能的提升以及系统资源的有效利用。在不同数据库管理系统(DBMS)之间,如从Oracle迁移到MySQL,虽然两个系统有着各自的特性,但是优化的核心思想...

    SQL优化工具下载,语句优化

    本文将深入探讨SQL优化工具及其对提升数据库性能的影响。 首先,SQL优化工具是专门设计用来帮助数据库管理员和开发人员识别和改进低效SQL查询的软件。这些工具通过分析SQL语句、执行计划和系统资源使用情况,提供...

Global site tag (gtag.js) - Google Analytics