高效SQL语句必杀技
No SQL,No cost. SQL语句是造成数据库开销最大的部分。而不良SQL写法直接导致数据库系统性能下降的情形比比皆是。那么如何才能称得
上高效的SQL语句呢?一是查询优化器为当前的SQL语句生成最佳的执行计划,保证数据读写使用最佳路径;二是设置合理的物理存储结构,如表
的类型,字段的顺序,字段的数据类型等。本文主要描述如何编写高效的SQL语句并给出示例。下面的描述主要分为三个部分,一是编写高效SQL
语句,二是使用索引提高查询性能的部分,三是总结部分。
一、编写高效SQL语句
- 1)选择最有效的表名顺序(仅适用于RBO模式)
- ORACLE的解析器总是按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中最后的一个表将作为驱动表被优先处理。当FROM子句
- 存在多个表的时候,应当考虑将表上记录最少的那个表置于FROM的最右端作为基表。Oracle会首先扫描基表(FROM子句中最后的那个表)并对
- 记录进行排序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。如
- 果有3个以上的表连接查询,那就需要选择交叉表(intersectiontable)作为基础表,交叉表是指那个被其他表所引用的表。
- 下面的例子使用最常见的scott或hr模式下的表进行演示
- 表EMP有14条记录
- 表DEPT有4条记录
- SELECT/*+rule*/COUNT(*)FROMemp,dept;--高效的写法
- scott@CNMMBO>setautotracetraceonlystat;
- scott@CNMMBO>SELECT/*+rule*/COUNT(*)FROMemp,dept;
- Elapsed:00:00:00.14
- Statistics
- ----------------------------------------------------------
- 1recursivecalls
- 0dbblockgets
- 35consistentgets
- 0physicalreads
- 0redosize
- 515bytessentviaSQL*Nettoclient
- 492bytesreceivedviaSQL*Netfromclient
- 2SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 1rowsprocessed
- SELECT/*+rule*/COUNT(*)FROMdept,emp;--低效的写法
- scott@CNMMBO>SELECT/*+rule*/COUNT(*)FROMdept,emp;
- Elapsed:00:00:00.02
- Statistics
- ----------------------------------------------------------
- 1recursivecalls
- 0dbblockgets
- 105consistentgets
- 0physicalreads
- 0redosize
- 515bytessentviaSQL*Nettoclient
- 492bytesreceivedviaSQL*Netfromclient
- 2SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 1rowsprocessed
- 2)select查询中避免使用'*'
- 当你想在SELECT子句中列出所有的COLUMN时,使用动态SQL列引用'*'是一个方便的方法.不幸的是,这是一个非常低效的方法.实际
- 上,ORACLE在解析的过程中,会将'*'依次转换成所有的列名,这个工作是通过查询数据字典完成的,这意味着将耗费更多的时间。
- 注:本文中的例子出于简化演示而使用了select*,生产环境应避免使用.
- 3)减少访问数据库的次数
- 每当执行一条SQL语句,Oracle需要完成大量的内部操作,象解析SQL语句,估算索引的利用率,绑定变量,读数据块等等.由此可
- 见,减少访问数据库的次数,实际上是降低了数据库系统开销
- -->下面通过3种方式来获得雇员编号为7788与7902的相关信息
- -->方式1(最低效):
- selectename,job,salfromempwhereempno=7788;
- selectename,job,salfromempwhereempno=7902;
- -->方式2(次低效):
- -->下面使用了参数游标来完成,每传递一次参数则需要对表emp访问一次,增加了I/O
- DECLARE
- CURSORC1(E_NONUMBER)IS
- SELECTename,job,sal
- FROMemp
- WHEREempno=E_NO;
- BEGIN
- OPENC1(7788);
- FETCHC1INTO…,…,…;
- ..
- OPENC1(7902);
- FETCHC1INTO…,…,…;
- CLOSEC1;
- END;
- -->方式3(最高效)
- SELECTa.ename
- ,a.job
- ,a.sal
- ,b.ename
- ,b.job
- ,b.sal
- FROMempa,empb
- WHEREa.empno=7788ORb.empno=7902;
- 注意:在SQL*Plus,SQL*Forms和Pro*C中重新设置ARRAYSIZE参数,可以增加每次数据库访问的检索数据量,建议值为200.
- 4)使用DECODE函数来减少处理时间
- -->使用decode函数可以避免重复扫描相同的行或重复连接相同的表
- selectcount(*),sum(sal)fromempwheredeptno=20andenamelike'SMITH%';
- selectcount(*),sum(sal)fromempwheredeptno=30andenamelike'SMITH%';
- -->通过使用decode函数一次扫描即可完成所有满足条件记录的处理
- SELECTCOUNT(DECODE(deptno,20,'x',NULL))d20_count
- ,COUNT(DECODE(deptno,30,'x',NULL))d30_count
- ,SUM(DECODE(deptno,20,sal,NULL))d20_sal
- ,SUM(DECODE(deptno,30,sal,NULL))d30_sal
- FROMemp
- WHEREenameLIKE'SMITH%';
- 类似的,DECODE函数也可以运用于GROUPBY和ORDERBY子句中。
- 5)整合简单,无关联的数据库访问
- -->如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中以提高性能(即使它们之间没有关系)
- -->整合前
- SELECTname
- FROMemp
- WHEREempno=1234;
- SELECTname
- FROMdept
- WHEREdeptno=10;
- SELECTname
- FROMcat
- WHEREcat_type='RD';
- -->整合后
- SELECTe.name,d.name,c.name
- FROMcatc
- ,dptd
- ,empe
- ,dualx
- WHERENVL('X',x.dummy)=NVL('X',e.ROWID(+))
- ANDNVL('X',x.dummy)=NVL('X',d.ROWID(+))
- ANDNVL('X',x.dummy)=NVL('X',c.ROWID(+))
- ANDe.emp_no(+)=1234
- ANDd.dept_no(+)=10
- ANDc.cat_type(+)='RD';
- -->从上面的SQL语句可以看出,尽管三条语句被整合为一条,性能得以提高,然可读性差,此时应权衡性能与代价
- 6)删除重复记录
- -->通过使用rowid来作为过滤条件,性能高效
- DELETEFROMempe
- WHEREe.ROWID>(SELECTMIN(x.ROWID)
- FROMempx
- WHEREx.empno=e.empno);
- 7)使用truncate代替delete
- -->通常情况下,任意记录的删除需要在回滚段构造删除前镜像以实现回滚(rollback).对于未提交的数据在执行rollback之后,Oracle会生成
- -->等价SQL语句去恢复记录(如delete,则生成对应的insert语句;如insert则生成对应的delete;如update,则是同时生成delete和insert
- -->使用truncate命令则是执行DDL命令,不产生任何回滚信息,直接格式化并释放高水位线.故该语句性能高效.由于不能rollback,因此慎用.
- 8)尽量多使用COMMIT(COMMIT应确保事务的完整性)
- -->只要有可能,在程序中尽量多使用COMMIT,这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少
- -->COMMIT所释放的资源:
- -->1.回滚段上用于恢复数据的信息
- -->2.释放语句处理期间所持有的锁
- -->3.释放redologbuffer占用的空间(commit将redologbuffer中的entries写入到联机重做日志文件)
- -->4.ORACLE为管理上述3种资源中的内部开销
- 9)计算记录条数
- -->一般的情况下,count(*)比count(1)稍快.如果可以通过索引检索,对索引列的计数是最快的,因为直接扫描索引即可,例如COUNT(EMPNO)
- -->实际情况是经测试上述三种情况并无明显差异.
- 10)用Where子句替换HAVING子句
- -->尽可能的避免having子句,因为HAVING子句是对检索出所有记录之后再对结果集进行过滤。这个处理需要排序,总计等操作
- -->通过WHERE子句则在分组之前即可过滤不必要的记录数目,从而减少聚合的开销
- -->低效:
- SELECTdeptno,AVG(sal)
- FROMemp
- GROUPBYdeptno
- HAVINGdeptno=20;
- scott@CNMMBO>SELECTdeptno,AVG(sal)
- 2FROMemp
- 3GROUPBYdeptno
- 4HAVINGdeptno=20;
- Statistics
- ----------------------------------------------------------
- 0recursivecalls
- 0dbblockgets
- 7consistentgets
- 0physicalreads
- 0redosize
- 583bytessentviaSQL*Nettoclient
- 492bytesreceivedviaSQL*Netfromclient
- 2SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 1rowsprocessed
- -->高效:
- SELECTdeptno,AVG(sal)
- FROMemp
- WHEREdeptno=20
- GROUPBYdeptno;
- scott@CNMMBO>SELECTdeptno,AVG(sal)
- 2FROMemp
- 3WHEREdeptno=20
- 4GROUPBYdeptno;
- Statistics
- ----------------------------------------------------------
- 0recursivecalls
- 0dbblockgets
- 2consistentgets
- 0physicalreads
- 0redosize
- 583bytessentviaSQL*Nettoclient
- 492bytesreceivedviaSQL*Netfromclient
- 2SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 1rowsprocessed
- 11)最小化表查询次数
- -->在含有子查询的SQL语句中,要特别注意减少对表的查询
- -->低效:
- SELECT*
- FROMemployees
- WHEREdepartment_id=(SELECTdepartment_id
- FROMdepartments
- WHEREdepartment_name='Marketing')
- ANDmanager_id=(SELECTmanager_id
- FROMdepartments
- WHEREdepartment_name='Marketing');
- -->高效:
- SELECT*
- FROMemployees
- WHERE(department_id,manager_id)=(SELECTdepartment_id,manager_id
- FROMdepartments
- WHEREdepartment_name='Marketing')
- -->类似更新多列的情形
- -->低效:
- UPDATEemployees
- SETjob_id=(SELECTMAX(job_id)FROMjobs),salary=(SELECTAVG(min_salary)FROMjobs)
- WHEREdepartment_id=10;
- -->高效:
- UPDATEemployees
- SET(job_id,salary)=(SELECTMAX(job_id),AVG(min_salary)FROMjobs)
- WHEREdepartment_id=10;
- 12)使用表别名
- -->在多表查询时,为所返回列使用表别名作为前缀以减少解析时间以及那些相同列歧义引起的语法错误
- 13)用EXISTS替代IN
- 在一些基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下,使用EXISTS(或NOTEXISTS)通常
- 将提高查询的效率.
- -->低效:
- SELECT*
- FROMemp
- WHEREsal>1000
- ANDdeptnoIN(SELECTdeptno
- FROMdept
- WHEREloc='DALLAS')
- -->高效:
- SELECT*
- FROMemp
- WHEREempno>1000
- ANDEXISTS
- (SELECT1
- FROMdept
- WHEREdeptno=emp.deptnoANDloc='DALLAS')
- 14)用NOTEXISTS替代NOTIN
- 在子查询中,NOTIN子句引起一个内部的排序与合并.因此,无论何时NOTIN子句都是最低效的,因为它对子查询中的表执行了一个全表
- 遍历.为避免该情形,应当将其改写成外部连接(OUTTERJOIN)或适用NOTEXISTS
- -->低效:
- SELECT*
- FROMemp
- WHEREdeptnoNOTIN(SELECTdeptno
- FROMdept
- WHEREloc='DALLAS');
- -->高效:
- SELECTe.*
- FROMempe
- WHERENOTEXISTS
- (SELECT1
- FROMdept
- WHEREdeptno=e.deptnoANDloc='DALLAS');
- -->最高效(尽管下面的查询最高效,并不推荐使用,因为列loc使用了不等运算,当表dept数据量较大,且loc列存在索引的话,则此时索引失效)
- SELECTe.*
- FROMempeLEFTJOINdeptdONe.deptno=d.deptno
- WHEREd.loc<>'DALLAS'
- 15)使用表连接替换EXISTS
- 一般情况下,使用表连接比EXISTS更高效
- -->低效:
- SELECT*
- FROMemployeese
- WHEREEXISTS
- (SELECT1
- FROMdepartments
- WHEREdepartment_id=e.department_idANDdepartment_name='IT');
- -->高效:
- SELECT*-->经测试此写法SQLplus下比上面的写法多一次逻辑读,而在Toad下两者结果一致
- FROMemployeeseINNERJOINdepartmentsdONd.department_id=e.department_id
- WHEREd.department_name='IT';
- 16)用EXISTS替换DISTINCT
- 对于一对多关系表信息查询时(如部门表和雇员表),应避免在select子句中使用distinct,而使用exists来替换
- -->低效:
- SELECTDISTINCTe.department_id,d.department_name
- FROMdepartmentsdINNERJOINemployeeseONd.department_id=e.department_id;
- -->高效:
- SELECTd.department_id,department_name
- fromdepartmentsd
- WHEREEXISTS
- (SELECT1
- FROMemployeese
- WHEREd.department_id=e.department_id);
- EXISTS使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果
- -->经测试此写法SQLplus下比上面的写法多一次逻辑读,而在Toad下两者结果一致
- 17)使用UNIONALL替换UNION(如果有可能的话)
- 当SQL语句需要UNION两个查询结果集时,这两个结果集合会以UNION-ALL的方式被合并,然后在输出最终结果前进行排序。
- 如果用UNIONALL替代UNION,这样排序就不是必要了。效率就会因此得到提高。
- 注意:
- UNIONALL会输出所有的结果集,而UNION则过滤掉重复记录并对其进行排序.因此在使用时应考虑业务逻辑是否允许当前的结果集存在重复现象
- 寻找低效的SQL语句
- -->下面的语句主要适用于从视图v$sqlarea中获得当前运行下且耗用buffer_gets较多的SQL语句
- SELECTexecutions
- ,disk_reads
- ,buffer_gets
- ,ROUND((buffer_gets
- -disk_reads)
- /buffer_gets,2)
- hit_ratio
- ,ROUND(disk_reads/executions,2)reads_per_run
- ,sql_text
- FROMv$sqlarea
- WHEREexecutions>0
- ANDbuffer_gets>0
- AND(buffer_gets
- -disk_reads)
- /buffer_gets<0.80
- ORDERBY4DESC;
- 18)尽可能避免使用函数,函数会导致更多的recursivecalls
二、合理使用索引以提高性能
索引依赖于表而存在,是真实表的一个缩影,类似于一本书的目录,通过目录以更快获得所需的结果。Oracle使用了一个复杂的自平衡
B数据结构。即任意记录的DML操作将打破索引的平衡,而定期重构索引使得索引重新获得平衡。通常,通过索引查找数据比全表扫描更高效。
任意的DQL或DML操作,SQL优化引擎优先使用索引来计算当前操作的成本以生成最佳的执行计划。一旦使用索引操出参数optimizer_index_cost_adj
设定的值才使用全表扫描。同样对于多表连接使用索引也可以提高效率。同时索引也提供主键(primary key)的唯一性验证。
除了那些LONG或LONG RAW数据类型,你可以索引几乎所有的列.通常,在大型表中使用索引特别有效.当然,你也会发现,在扫描小表时,使用索
引同样能提高效率。
虽然使用索引能得到查询效率的提高,但是索引需要空间来存储,需要定期维护.尤其是在有大量DML操作的表上,任意的DML操作都将引起索
引的变更这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O . 因为索引需要额外的存储空间和处理,
那些不必要的索引反而会使查询反应时间变慢。
DML操作使用索引上存在碎片而失去高度均衡,因此定期的重构索引是有必要的.
- 1)避免基于索引列的计算
- where子句中的谓词上存在索引,而此时基于该列的计算将使得索引失效
- -->低效:
- SELECTemployee_id,first_name
- FROMemployees
- WHEREemployee_id+10>150;-->索引列上使用了计算,因此索引失效,走全表扫描方式
- -->高效:
- SELECTemployee_id,first_name
- FROMemployees
- WHEREemployee_id>160;-->走索引范围扫描方式
- 例外情形
- 上述规则不适用于SQL中的MIN和MAX函数
- hr@CNMMBO>SELECTMAX(employee_id)max_id
- 2FROMemployees
- 3WHEREemployee_id
- 4+10>150;
- 1rowselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:1481384439
- ---------------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- ---------------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||1|4|1(0)|00:00:01|
- |1|SORTAGGREGATE||1|4|||
- |2|FIRSTROW||5|20|1(0)|00:00:01|
- |*3|INDEXFULLSCAN(MIN/MAX)|EMP_EMP_ID_PK|5|20|1(0)|00:00:01|
- ---------------------------------------------------------------------------------------------
- 2)避免在索引列上使用NOT运算或不等于运算(<>,!=)
- 通常,我们要避免在索引列上使用NOT或<>,两者会产生在和在索引列上使用函数相同的影响。当ORACLE遇到NOT或不等运算时,他就会停止
- 使用索引转而执行全表扫描。
- -->低效:
- SELECT*
- FROMemp
- WHERENOT(deptno=20);-->实际上NOT(deptno=20)等同于deptno<>20,即deptno<>同样会限制索引
- -->高效:
- SELECT*
- FROMemp
- WHEREdeptno>20ORdeptno<20;
- -->尽管此方式可以替换且实现上述结果,但依然走全表扫描,如果是单纯的>或<运算,则此时为索引范围扫描
- 需要注意的是,在某些时候,ORACLE优化器会自动将NOT转化成相对应的关系操作符
- 其次如果是下列运算符进行NOT运算,依然有可能选择走索引,仅仅除了NOT=之外,因为NOT=等价于<>
- “NOT>”to<=
- “NOT>=”to<
- “NOT<”to>=
- “NOT<=”to>
- 来看一个实际的例子
- hr@CNMMBO>SELECT*
- 2FROMemployees
- 3wherenotemployee_id<100;-->索引列上使用了not,但是该查询返回了所有的记录,即107条,因此此时选择走全表扫描
- 107rowsselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:1445457117
- -------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- -------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||107|7276|3(0)|00:00:01|
- |*1|TABLEACCESSFULL|EMPLOYEES|107|7276|3(0)|00:00:01|-->执行计划中使用了走全表扫描方式
- -------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 1-filter("EMPLOYEE_ID">=100)-->查看这里的谓词信息被自动转换为>=运算符
- hr@CNMMBO>SELECT*
- 2FROMemployees
- 3wherenotemployee_id<140;-->此例与上面的语句相同,仅仅是查询范围不同返回67条记录,而此时选择了索引范围扫描
- 67rowsselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:603312277
- ---------------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- ---------------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||68|4624|3(0)|00:00:01|
- |1|TABLEACCESSBYINDEXROWID|EMPLOYEES|68|4624|3(0)|00:00:01|
- |*2|INDEXRANGESCAN|EMP_EMP_ID_PK|68||1(0)|00:00:01|-->索引范围扫描方式
- ---------------------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 2-access("EMPLOYEE_ID">=140)
- 3)用UNION替换OR(适用于索引列)
- 通常情况下,使用UNION替换WHERE子句中的OR将会起到较好的效果.基于索引列使用OR使得优化器倾向于使用全表扫描,而不是扫描索引.
- 注意,以上规则仅适用于多个索引列有效。如果有column没有被索引,查询效率可能会因为你没有选择OR而降低。
- -->低效:
- SELECTdeptno,dname
- FROMdept
- WHEREloc='DALLAS'ORdeptno=20;
- -->高效:
- SELECTdeptno,dname
- FROMdept
- WHEREloc='DALLAS'
- UNION
- SELECTdeptno,dname
- FROMdept
- WHEREdeptno=30
- -->经测试,由于数据量较少,此时where子句中的谓词上都存在索引列时,两者性能相当.
- -->假定where子句中存在两列
- scott@CNMMBO>createtablet6asselectobject_id,owner,object_namefromdba_objectswhereowner='SYS'andrownum<1001;
- scott@CNMMBO>insertintot6selectobject_id,owner,object_namefromdba_objectswhereowner='SCOTT'andrownum<6;
- scott@CNMMBO>createindexi_t6_object_idont6(object_id);
- scott@CNMMBO>createindexi_t6_owneront6(owner);
- scott@CNMMBO>insertintot6selectobject_id,owner,object_namefromdba_objectswhereowner='SYSTEM'andrownum<=300;
- scott@CNMMBO>commit;
- scott@CNMMBO>execdbms_stats.gather_table_stats('SCOTT','T6',cascade=>true);
- scott@CNMMBO>selectowner,count(*)fromt6groupbyowner;
- OWNERCOUNT(*)
- ------------------------------
- SCOTT5
- SYSTEM300
- SYS1000
- scott@CNMMBO>select*fromt6whereowner='SCOTT'andrownum<2;
- OBJECT_IDOWNEROBJECT_NAME
- --------------------------------------------------
- 69450SCOTTT_TEST
- scott@CNMMBO>select*fromt6whereobject_id=69450orowner='SYSTEM';
- 301rowsselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:238853296
- -----------------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- -----------------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||300|7200|5(0)|00:00:01|
- |1|CONCATENATION||||||
- |2|TABLEACCESSBYINDEXROWID|T6|1|24|2(0)|00:00:01|
- |*3|INDEXRANGESCAN|I_T6_OBJECT_ID|1||1(0)|00:00:01|
- |*4|TABLEACCESSBYINDEXROWID|T6|299|7176|3(0)|00:00:01|
- |*5|INDEXRANGESCAN|I_T6_OWNER|300||1(0)|00:00:01|
- -----------------------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 3-access("OBJECT_ID"=69450)
- 4-filter(LNNVL("OBJECT_ID"=69450))
- 5-access("OWNER"='SYSTEM')
- Statistics
- ----------------------------------------------------------
- 0recursivecalls
- 0dbblockgets
- 46consistentgets
- 0physicalreads
- 0redosize
- 11383bytessentviaSQL*Nettoclient
- 712bytesreceivedviaSQL*Netfromclient
- 22SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 301rowsprocessed
- scott@CNMMBO>select*fromt6whereowner='SYSTEM'orobject_id=69450;
- 301rowsselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:238853296
- -----------------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- -----------------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||300|7200|5(0)|00:00:01|
- |1|CONCATENATION||||||
- |2|TABLEACCESSBYINDEXROWID|T6|1|24|2(0)|00:00:01|
- |*3|INDEXRANGESCAN|I_T6_OBJECT_ID|1||1(0)|00:00:01|
- |*4|TABLEACCESSBYINDEXROWID|T6|299|7176|3(0)|00:00:01|
- |*5|INDEXRANGESCAN|I_T6_OWNER|300||1(0)|00:00:01|
- -----------------------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 3-access("OBJECT_ID"=69450)
- 4-filter(LNNVL("OBJECT_ID"=69450))
- 5-access("OWNER"='SYSTEM')
- Statistics
- ----------------------------------------------------------
- 1recursivecalls
- 0dbblockgets
- 46consistentgets
- 0physicalreads
- 0redosize
- 11383bytessentviaSQL*Nettoclient
- 712bytesreceivedviaSQL*Netfromclient
- 22SQL*Netroundtripsto/fromclient
- 0sorts(memory)
- 0sorts(disk)
- 301rowsprocessed
- scott@CNMMBO>select*fromt6
- 2whereobject_id=69450
- 3union
- 4select*fromt6
- 5whereowner='SYSTEM';
- 301rowsselected.
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:370530636
- ------------------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- ------------------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||301|7224|7(72)|00:00:01|
- |1|SORTUNIQUE||301|7224|7(72)|00:00:01|
- |2|UNION-ALL||||||
- |3|TABLEACCESSBYINDEXROWID|T6|1|24|2(0)|00:00:01|
- |*4|INDEXRANGESCAN|I_T6_OBJECT_ID|1||1(0)|00:00:01|
- |5|TABLEACCESSBYINDEXROWID|T6|300|7200|3(0)|00:00:01|
- |*6|INDEXRANGESCAN|I_T6_OWNER|300||1(0)|00:00:01|
- ------------------------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 4-access("OBJECT_ID"=69450)
- 6-access("OWNER"='SYSTEM')
- Statistics
- ----------------------------------------------------------
- 1recursivecalls
- 0dbblockgets
- 7consistentgets
- 0physicalreads
- 0redosize
- 11383bytessentviaSQL*Nettoclient
- 712bytesreceivedviaSQL*Netfromclient
- 22SQL*Netroundtripsto/fromclient
- 1sorts(memory)
- 0sorts(disk)
- 301rowsprocessed
- -->从上面的统计信息可知,consistentgets由46下降为7,故当where子句中谓词上存在索引时,使用union替换or更高效
- -->即使当列object_id与owner上不存在索引时,使用union仍然比or更高效(在Oracle10gR2与Oracle11gR2测试)
- 4)避免索引列上使用函数
- -->下面是一个来自实际生产环境的例子
- -->表acc_pos_int_tbl上business_date列存在索引,由于使用了SUBSTR函数,此时索引失效,使用全表扫描
- SELECTacc_num
- ,curr_cd
- ,DECODE('20110728'
- ,(SELECTTO_CHAR(LAST_DAY(TO_DATE('20110728','YYYYMMDD')),'YYYYMMDD')FROMdual),0
- ,adj_credit_int_lv1_amt
- +adj_credit_int_lv2_amt
- -adj_debit_int_lv1_amt
- -adj_debit_int_lv2_amt)
- ASinterest
- FROMacc_pos_int_tbl
- WHERESUBSTR(business_date,1,6)=SUBSTR('20110728',1,6)ANDbusiness_date<='20110728';
- -->改进的办法
- SELECTacc_num
- ,curr_cd
- ,DECODE('20110728'
- ,(SELECTTO_CHAR(LAST_DAY(TO_DATE('20110728','YYYYMMDD')),'YYYYMMDD')FROMdual),0
- ,adj_credit_int_lv1_amt
- +adj_credit_int_lv2_amt
- -adj_debit_int_lv1_amt
- -adj_debit_int_lv2_amt)
- ASinterest
- FROMacc_pos_int_tblacc_pos_int_tbl
- WHEREbusiness_date>=TO_CHAR(LAST_DAY(ADD_MONTHS(TO_DATE('20110728','yyyymmdd'),-1))
- +1,'yyyymmdd')
- ANDbusiness_date<='20110728';
- -->下面的例子虽然没有使用函数,但字符串连接同样导致索引失效
- -->低效:
- SELECTaccount_name,amount
- FROMtransaction
- WHEREaccount_name
- ||account_type='AMEXA';
- -->高效:
- SELECTaccount_name,amount
- FROMtransaction
- WHEREaccount_name='AMEX'ANDaccount_type='A';
- 5)比较不匹配的数据类型
- -->下面的查询中business_date列上存在索引,且为字符型,这种
- -->低效:
- SELECT*
- FROMacc_pos_int_tbl
- WHEREbusiness_date=20090201;
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:2335235465
- -------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- -------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||37516|2857K|106K(1)|00:21:17|
- |*1|TABLEACCESSFULL|ACC_POS_INT_TBL|37516|2857K|106K(1)|00:21:17|
- -------------------------------------------------------------------------------------
- PredicateInformation(identifiedbyoperationid):
- ---------------------------------------------------
- 1-filter(TO_NUMBER("BUSINESS_DATE")=20090201)-->这里可以看到产生了类型转换
- -->高效:
- SELECT*
- FROMacc_pos_int_tbl
- WHEREbusiness_date='20090201'
- 6)索引列上使用NULL值
- ISNULL和ISNOTNULL会限制索引的使用,因为数据中没有值等于NULL值,即便是NULL值也不等于NULL值.且NULL值不存储在于索引之中
- 因此应尽可能避免在索引类上使用NULL值
- SELECTacc_num
- ,pl_cd
- ,order_qty
- ,trade_date
- FROMtrade_client_tbl
- WHEREinput_dateISNOTNULL;
- ExecutionPlan
- ----------------------------------------------------------
- Planhashvalue:901462645
- --------------------------------------------------------------------------------------
- |Id|Operation|Name|Rows|Bytes|Cost(%CPU)|Time|
- --------------------------------------------------------------------------------------
- |0|SELECTSTATEMENT||1|44|15(0)|00:00:01|
- |*1|TABLEACCESSFULL|TRADE_CLIENT_TBL|1|44|15(0)|00:00:01|
- --------------------------------------------------------------------------------------
- altertabletrade_client_tblmodify(input_datenotnull);
- 不推荐使用的查询方式
- SELECT*FROMtable_nameWHEREcolISNOTNULL
- SELECT*FROMtable_nameWHEREcolISNULL
- 推荐使用的方式
- SELECT*FROMtable_nameWHEREcol>=0--尽可能的使用=,>=,<=,like等运算符
- -->Author:RobinsonCheng
- -->Blog:http://blog.csdn.net/robinson_0612
三、总结
1、尽可能最小化基表数据以及中间结果集(通过过滤条件避免后续产生不必要的计算与聚合)
2、为where子句中的谓词信息提供最佳的访问路径(rowid访问,索引访问)
3、使用合理的SQL写法来避免过多的Oracle内部开销以提高性能
4、合理的使用提示以提高表之间的连接来提高连接效率(如避免迪卡尔集,将不合理的嵌套连接改为hash连接等)
四、更多参考
dbms_xplan之display_cursor函数的使用
相关推荐
Oracle 高效 SQL 语句原则 Oracle 高效 SQL 语句原则是指在编写 Oracle 数据库 SQL 语句时需要遵循的一些基本原则,以便提高 SQL 语句的执行效率,减少数据库服务器的负载,提高应用程序的性能。下面是 Oracle 高效...
在实际工作中,合理利用"SQL语句万能生成器"这样的工具,结合个人的SQL知识,能够更高效地完成数据库操作,提升工作效率。在压缩包文件"sql_ok"中,可能包含了这样一个工具的安装程序或使用教程,可以帮助你开始探索...
【如何编写高效SQL语句】 在数据库管理中,编写高效的SQL语句对于系统性能的优化至关重要。本篇将深入探讨性能调整的综合观点、有效应用设计以及SQL语句处理的过程,帮助你提升数据库系统的整体效率。 首先,性能...
本项目提供了一个Java源码工具,能够帮助用户便捷地将Oracle SQL语句转换为MySQL SQL语句。 Oracle SQL与MySQL SQL的主要差异在于以下几个方面: 1. **数据类型**:Oracle支持的数据类型如NUMBER、LONG、RAW等在...
sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明sql语句说明...
在Java编程中,调试SQL语句是开发过程中的常见任务,尤其当面对复杂且冗长的查询时。为了提高效率并使SQL语句更易于理解和分析,格式化SQL语句显得尤为重要。标题提及的"Java打印漂亮的SQL语句(被格式化的SQL语句)...
在开发数据库应用程序时,SQL语句是至关重要的工具,用于查询、插入、更新和删除数据库中的数据。本文将深入探讨SQL语句命令及其在数据库操作中的应用,特别是使用ADO.NET框架进行数据库交互。 首先,我们需要了解...
PB脚本中SQL语句写法与SQL中语句写法对照 PB脚本中SQL语句写法与SQL中语句写法对照是非常重要的知识点,因为PB脚本和SQL语言在写法和应用中有所不同。本文将对PB脚本中SQL语句写法和SQL中语句写法进行对比和分析。 ...
高效SQL语句测试使用没什么用不要浪费时间
sql语句sql语句sql语句sql语句sql语句
在实际开发中,有时我们需要了解LINQ查询是如何转换为SQL语句的,以便于调试和优化性能。以下将详细介绍几种查看LINQ生成SQL语句的方法。 1. **Debug.WriteLine()** 在使用LINQ查询时,可以利用`Debug.WriteLine()...
使用问号参数化查询是编写安全、高效SQL语句的关键实践。它不仅可以防范SQL注入,还能优化性能,同时减少因字符串拼接导致的潜在错误。在Java等编程语言中,通过`PreparedStatement`接口,我们可以轻松实现这一功能...
ArcGIS软件提供了丰富的工具和界面,允许用户通过SQL语句对地理空间数据进行高效的操作。 #### 二、SQL语句类型及其在ArcGIS中的运用 ##### 1. 数据操作语言(DML) DML主要用于对数据库中的数据进行增删改查操作,...
### 完成超长SQL语句执行前拆分 #### 概述 在使用Visual Basic (简称VB)进行数据库操作时,可能会遇到因为SQL语句过长而导致无法正常执行的问题。这种情况下,即使该SQL语句可以在SQL Server的查询分析器中成功运行...
非常好用的SQL Server 抓取SQL语句工具HOOK 非常好用的SQL Server 抓取SQL语句工具HOOK 非常好用的SQL Server 抓取SQL语句工具HOOK 非常好用的SQL Server 抓取SQL语句工具HOOK
本文将围绕“SQL执行超长语句”这一主题进行深入探讨,包括超长语句可能出现的原因、如何编写更加高效合理的超长SQL语句以及如何优化执行性能等方面。 #### 一、超长SQL语句的定义与常见场景 ##### 定义 超长SQL...
这篇博客“mybatis直接执行sql语句后续之一”可能探讨了如何在MyBatis中高效且有效地执行SQL操作。下面我们将深入探讨MyBatis的SQL执行机制及相关知识点。 首先,MyBatis的核心组件是SqlSessionFactory,它是创建...
### 动态执行SQL语句在Oracle中的应用 #### 标题解读 “存储过程中怎么动态执行SQL语句”这一标题表明文章将介绍如何在Oracle数据库的存储过程中编写能够动态执行的SQL语句。动态SQL是指在运行时才能确定其具体内容...
在IT行业中,数据库管理和数据...总结来说,"通过解析SQL语句获取表血缘关系项目"是一个关键的数据管理实践,它依赖于对SQL的深入理解和合适的工具,以揭示数据库中的数据流动路径,从而支持更高效、更合规的数据操作。