`
kiddwyl
  • 浏览: 402613 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

Oracle高级SQL调优:CLUSTER_FACTOR案例研究

阅读更多
大家在大型数据库生产系统的运维中可能会遇到这样一个问题,一条查询语句,操作的是相同的表和数据,为什么在生产数据库上执行起来就很慢,而在备份数据库反而会很快。这其中一个重要原因就在于索引CLUSTER_FACTOR的不同。
  Oracle数据库下,索引在做完统计分析后,会获得很多重要信息,其中之一就是CLUSTER_FACTOR,CLUSTER_FACTOR表示索引数据顺序和表数据顺序的一致性,关于CLUSTER_FACTOR的理论和机制分析见随后作者的文章,Oracle高级SQL调优之:CLUSTER_FACTOR机制研究。
  CLUSTER_FACTOR的精彩之处就在于,能借此区分看来貌似完全相同的情况:表结构、表数据和索引完全相同,但就是表数据行的存储顺序不同。下面以案例的形式加以分析。
  1. 研究结论
  CLUSTER_FACTOR对Oracle执行计划会产生重要影响。这个值越高,说明索引的使用效率将会越差。这个值会存在于一个区间内,区间的最小值为表占用的数据块数,最大值为表拥有的数据行数。
  2. 研究对象
  研究对象为两个数据表TESTCF和TESTCF2,两者的数据结构相同,都只有两列:ID列,整数型,name列,字符型,80个字符,数据相同,都8万行,占用1024个数据块。不同的在于两个表的数据行的存储顺序不同,TESTCF表的数据,按照ID值从小到大的顺序依次存储,而TESTCF2表的数据,随机杂乱存储。
  3. 案例实验过程
  3.1 系统配置:
  Oracle 11.1.0.6,初始化参数optimizer_index_cost_adj为默认值100
  SQL> SELECT * FROM v$version;
  BANNER
  --------------------------------------------------------------------------------
  Oracle Database 11g Enterprise Edition Release 11.1.0.6.0 - Production
  PL/SQL Release 11.1.0.6.0 - Production
  CORE 11.1.0.6.0 Production
  TNS for 32-bit Windows: Version 11.1.0.6.0 - Production
  NLSRTL Version 11.1.0.6.0 – Production
  SQL> SELECT name, type, value FROM v$parameter p WHERE p.name = ’optimizer_index_cost_adj’;
  NAME TYPE VALUE
  ------------------------------ ---------- --------------------
  optimizer_index_cost_adj 3 100  3.2 创建表TESTCF和TESTCF2
  设置表TESCF控制其行长度和行数使得总共占用约1024个数据块
  表定义:每行至少80个字节,共8万行,PCTFREE = 0,初始盘区和NEXT盘区都为1M
  3.2.1 创建表TESTCF,并产生数据
  数据的两列,分别由类序列值和随机函数产生,随机函数直接产生80位长的字符
  SQL> CREATE TABLE TESTCF
  2 (
  3 ID NUMBER(32),
  4 NAME VARCHAR2(80)
  5 )
  6 TABLEspace USERS
  7 pctfree 0
  8 initrans 1
  9 maxtrans 255
  10 storage
  11 (
  12 initial 1M
  13 next 1M
  14 minextents 1
  15 maxextents unlimited
  16 );
  表已创建。
  已用时间: 00: 00: 00.06
  SQL> begin
  2 for i in 1..80000 loop
  3 insert into TESTCF(id, name)
  4 values(i,dbms_random.string(’a’,80));
  5 end loop;
  6 commit;
  7 end;
  8 /
  PL/SQL 过程已成功完成。
  已用时间: 00: 00: 18.53  3.2.2 创建表TESTCF2
  该表和表TESTCF结构相同,且数据相同。将TESTCF表的所有数据灌入TESTCF2以获得相应信息。
  重要:灌入时,让数据随机的进入TESTCF2,由dbms_random控制员Vぷ愎坏乃婊浴?BR>  SQL> CREATE TABLE TESTCF2
  2 (
  3 ID NUMBER(32),
  4 NAME VARCHAR2(80)
  5 )
  6 TABLEspace USERS
  7 pctfree 0
  8 initrans 1
  9 maxtrans 255
  10 storage
  11 (
  12 initial 1M
  13 next 1M
  14 minextents 1
  15 maxextents unlimited
  16 );
  表已创建。
  已用时间: 00: 00: 00.04
  SQL>
  SQL> insert into TESTCF2 nologging
  2 SELECT * FROM TESTCF order by dbms_random.random;
  已创建80000行。
  已用时间: 00: 00: 01.28
  SQL>
  SQL> commit;
  提交完成。
  已用时间: 00: 00: 00.00  3.3 给两个表都创建PK
  SQL> alter TABLE TESTCF add constraint pk_TESTCF primary key(id);
  表已更改。
  已用时间: 00: 00: 00.71
  SQL>
  SQL> alter TABLE TESTCF2 add constraint pk_TESTCF2 primary key(id);
  表已更改。
  已用时间: 00: 00: 00.37
  表都为1024个数据块,索引都为256个数据块。
  SQL> SELECT t.SEGMENT_NAME, t.SEGMENT_TYPE, t.BLOCKS FROM user_segments t WHERE t.SEGMENT_NAME like ’%TESTCF%’;
  SEGMENT_NAME SEGMENT_TYPE BLOCKS
  -------------------- ------------------------------------ ----------
  TESTCF2 TABLE 1024
  PK_TESTCF INDEX 256
  TESTCF TABLE 1024
  PK_TESTCF2 INDEX 256
  已用时间: 00: 00: 00.10
  3.4 查看数据样例
  SQL> SELECT * FROM TESTCF WHERE rownum < 3;
  ID NAME
  ---------- --------------------------------------------------------------------------------
  1 XMaMnroMsEWEamYPDopXkESqZkNbQrxlOeXsaHIGZIRrAnrTzPRtoOawwooEimyGjtwBuhWcxHPlsKKY
  2 AeVFFXiLTLwJtGNJCOtvUOvwWgfhZkVxTJJoKgRDFtKonklzVIgNZFUXLAnfHDImVGxDnfMHHEjIzhvs
  已用时间: 00: 00: 00.00
  SQL> SELECT * FROM TESTCF2 WHERE rownum < 3;
  ID NAME
  ---------- --------------------------------------------------------------------------------
  39312 uWNqugvticIHolgfCcbNIVHOUTESzhVPhwLJeEydkUKfuywcCkiKyRkPqSIuNRJQYURSqeJnwmsDTEqW
  41453 cOSqPzChzGBYkHnJbhIGbwUYBKquCBRcTNHbyHyVjdNItSxpxDKWXzSdYIkSBUJSUIziOleLLWPVOSNy
  已用时间: 00: 00: 00.01  3.5分别产生统计数据,然后查看两个表PK索引的CLUSTER_FACTOR
  可以看出两表PK索引的CLUSTER_FACTOR值相差甚远。
  TESTCF表的值为908,接近于表的数据块数(1024),
  TESTCF2表的值为79913,接近于表的数据行数(80000),
  这说明,当数据行的存储顺序和索引顺序越接近,CLUSTER_FACTOR越小,越有利于使用索引。
  SQL> begin
  2 dbms_stats.gather_TABLE_stats(ownname => user,tabname => ’TESTCF’,cascade => true);
  3 end;
  4 /
  PL/SQL 过程已成功完成。
  已用时间: 00: 00: 00.93
  SQL> begin
  2 dbms_stats.gather_TABLE_stats(ownname => user,tabname => ’TESTCF2’,cascade => true);
  3 end;
  4 /
  PL/SQL 过程已成功完成。
  已用时间: 00: 00: 00.45
  SQL> SELECT i.index_name, i.CLUSTERING_FACTOR FROM dba_indexes i WHERE i.index_name like ’PK_TESTCF%’;
  INDEX_NAME CLUSTERING_FACTOR
  ------------------------------ -----------------
  PK_TESTCF 908
  PK_TESTCF2 79913
  3.6 测试CLUSTER_FACTOR对执行计划的影响
  执行相同的查询语句,获得一段连续id内的数据行,以检查CLUSTER_FACTOR对执行计划的影响
  从实验可以看出,CLUSTER_FACTOR对执行计划产生了巨大影响,这使得
  a) TESTCF表的执行计划,走的是INDEX RANGE SCAN,而test2表走的是TABLE ACCESS FULL
  同事这导致TESTCF表的总cost为83,TESTCF2表的总cost为210,是后者的四倍。
  b) TESTCF表的物理读和一致性读远小少于TESTCF2。
  SQL> alter system flush buffer_cache;
  系统已更改。
  已用时间: 00: 00: 00.06
  SQL> set autotrace traceonly;
  SQL> SELECT * FROM TESTCF WHERE id > 2000 and id < 8000;
  已选择5999行。
  已用时间: 00: 00: 00.65  执行计划
  ----------------------------------------------------------
  Plan hash value: 2216396729
  --------------------------------------------------------------------------------------
  | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time
  --------------------------------------------------------------------------------------
  | 0 | SELECT STATEMENT | | 6001 | 498K| 83 (0)| 00:00:0
  | 1 | TABLE ACCESS BY INDEX ROWID| TESTCF | 6001 | 498K| 83 (0)| 00:00:0
  |* 2 | INDEX RANGE SCAN | PK_TESTCF | 6001 | | 14 (0)| 00:00:0
  --------------------------------------------------------------------------------------
  Predicate Information (identified by operation id):
  ---------------------------------------------------
  2 - access("ID">2000 AND "ID"<8000)
  统计信息
  ----------------------------------------------------------
  320 recursive calls
  0 db block gets
  929 consistent gets
  121 physical reads
  0 redo size
  592212 bytes sent via SQL*Net to client
  4774 bytes received via SQL*Net FROM client
  401 SQL*Net roundtrips to/FROM client
  5 sorts (memory)
  0 sorts (disk)
  5999 rows processed
  SQL> alter system flush buffer_cache;
  系统已更改。
  已用时间: 00: 00: 00.03
  SQL> set autotrace traceonly;
  SQL> SELECT * FROM TESTCF2 WHERE id > 2000 and id < 8000;
  已选择5999行。
  已用时间: 00: 00: 00.59  执行计划
  ----------------------------------------------------------
  Plan hash value: 4178501150
  -----------------------------------------------------------------------------
  | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |
  -----------------------------------------------------------------------------
  | 0 | SELECT STATEMENT | | 6001 | 498K| 210 (2)| 00:00:03 |
  |* 1 | TABLE ACCESS FULL| TESTCF2 | 6001 | 498K| 210 (2)| 00:00:03 |
  -----------------------------------------------------------------------------
  Predicate Information (identified by operation id):
  ---------------------------------------------------
  1 - filter("ID"<8000 AND "ID">2000)
  统计信息
  ----------------------------------------------------------
  312 recursive calls
  0 db block gets
  1383 consistent gets
  944 physical reads
  0 redo size
  568273 bytes sent via SQL*Net to client
  4774 bytes received via SQL*Net FROM client
  401 SQL*Net roundtrips to/FROM client
  5 sorts (memory)
  0 sorts (disk)
  5999 rows processed
  SQL>
分享到:
评论

相关推荐

    ORACLE 19C SQL调优指南 中文版 Oracle DBA

    Oracle 19C SQL调优是数据库管理员(DBA)日常工作中不可或缺的一部分,它涉及到优化SQL查询性能,提高数据库系统的整体效率。本指南针对Oracle 19C版本,提供了丰富的调优策略和技术,旨在帮助DBA们更好地管理和维护...

    Oracle 19C SQL调优指南 中文版 DBA优化利器

    《Oracle 19C SQL调优指南》是针对Oracle数据库管理员(DBA)的重要参考资料,尤其适合那些希望提升SQL性能的专业人士。SQL调优是数据库管理中的核心技能,它关乎到系统的响应时间、资源利用率和整体性能。Oracle 19C...

    ORACLE 19C SQL调优指南.chm

    Oracle 19C SQL调优优化指南,全面提升SQL优化能力,DBA必备,开发必备

    Oracle Sql性能调优.ppt

    Oracle Sql 性能调优 Oracle SQL 性能调优是一个非常重要的课题,它涉及到 Oracle 数据库的性能优化,包括 SQL 语句优化、索引使用优化、多表关联查询操作优化、SQL 执行计划优化等。下面是Oracle SQL 性能调优的...

    ORACLE_SQL调优

    ORACLE_SQL调优老方块出品,深入讲解了ORACLE原理及常见SQL调优技巧

    Oracle_Database_10g:SQL_Fundamentals中文版

    Oracle_Database_10g:SQL_Fundamentals中文版

    Oracle SQL 优化与调优技术详解-随书脚本.zip

    Oracle SQL 优化与调优是数据库管理中的关键环节,它涉及到如何提高查询性能,减少资源消耗,提升系统整体效率。本书脚本集包含了多个实用工具和示例,旨在帮助数据库管理员深入理解Oracle SQL的工作原理,并提供...

    ORACLE执行计划和SQL调优

    【Oracle执行计划和SQL调优】是数据库管理中至关重要的环节,主要涉及到如何高效地运行SQL语句,提高数据库性能。下面将详细讲解执行计划的相关概念以及SQL调优的策略。 1. **Rowid的概念**:Rowid是Oracle数据库中...

    高性能SQL调优

    在IT行业中,数据库性能优化是至关重要的,尤其是在大型企业或高并发的应用场景下。Oracle数据库作为业界广泛使用的数据库管理系统,其SQL调优是...通过学习和研究这些资料,可以提升在Oracle SQL调优方面的专业能力。

    Oracle SQL自动调优生成报告和SQL语句的脚本

    Oracle SQL自动调优是数据库管理中的重要环节,它涉及到数据库性能优化,确保系统运行高效、稳定。这篇博客文章“Oracle SQL自动调优生成报告和SQL语句的脚本”提供了有关如何利用Oracle自带的工具进行SQL优化的具体...

    oracle ocm sql调优教程

    总的来说,这个教程将带你深入理解Oracle数据库的SQL调优技巧,从理论到实践,从基础到高级,全面提升你在面对复杂SQL性能问题时的解决能力。通过学习这个教程,你将能够更好地优化你的数据库,提高系统的整体性能。

    最实用的Oracle_SQL调优

    Oracle SQL调优是数据库性能优化的关键环节,尤其是在大型企业应用中,高效的SQL查询能够显著提升系统性能,降低I/O瓶颈的影响。以下是对标题和描述中所述知识点的详细说明: 1. **选择合适的Oracle优化器** ...

    oracle 数据库sql调优.doc

    ### Oracle 数据库 SQL 调优详解 #### 引言 在现代信息技术领域,数据库作为信息系统的核心组件之一,其性能的高低直接影响着整个系统的运行效率。对于Oracle数据库而言,SQL语句的优化是一项极其重要的工作。合理...

    Oracle_SQL调优课程教材

    SQL statement • Monitor the use of shared SQL areas • Write SQL statements to take advantage of shared SQL areas • Understand how to use the CURSOR_SHARING parameter • Use automatic PGA memory ...

    oracle sql调优培训大纲

    Oracle SQL调优是数据库管理员和开发人员提升数据库性能的关键技能之一。在Oracle数据库环境中,SQL调优涉及到优化查询语句,以减少资源消耗,提高数据处理速度,进而改善整体系统性能。以下是一份详细的Oracle SQL...

Global site tag (gtag.js) - Google Analytics