sangei

浏览: 340945 次
性别:
来自: 西安

最近访客更多访客>>

flymeqaqflyme

darui.wu

snrje

gongchuanbo

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

（转）Oracle sql 优化1

博客分类：

oracle sql

oracle 优化查询优化 rowid rownum

ORACLE有个高速缓冲的概念，这个高速缓冲呢就是存放执行过的SQL语句，那oracle在执行sql语句的时候要做很多工作，例如解析sql语句，估算索引利用率，绑定变量，读取数据块等等这些操作。假设高速缓冲里已经存储了执行过的sql语句，那就直接匹配执行了，少了步骤，自然就快了，但是经过测试会发现高速缓冲只对简单的表起作用，多表的情况小完全没有效果啊，例如在查询单表的时候那叫一个快，但是假设连接多个表，就龟速了。

最重要一点，ORACLE的高速缓冲是全字符匹配的，什么意思呢，看下面三个select

--No.1
select * from tableA;
--No.2
select * From tableA;
--No.3
select   * from tableA;

这三个语句乍一看是一样的，但是高速缓存是不认的，是全字符匹配的，索引在高速缓存里会存储三条不同的语句，说道这里，又引出一个习惯，就是要保持良好的编程习惯，这个很重要啊。

ORACLE的多表优化我积累了一些，都是常用的，介绍下

第一点呢是From 子句后面的表顺序有讲究

先说为啥，ORACLE在解析sql语句的时候对From子句后面的表名是从右往左解析的，是先扫描最右边的表，然后在扫描左边的表，然后用左边的表匹配数据，匹配成功后就合并。

所以，在对多表查询中，一定要把小表写在最右边，为什么自己想想就明白了。例如下面的两个语句：

--No.1  tableA 100w条记录  tableB 1w条记录 执行速度 十秒级
select count(*) from tableA,tableB;
  
--No.2  执行速度百秒级甚至更高
select count(*) from tableB,tableA;

这个估计很多人都知道，但是要确认非常有用。

还有一种是三张表的查询，例如

select count(1) from tableA a,tableB b ,tableC c where a.id=b.id and a.id=c.id;

上面种 tableA 就称为交叉表，根据oracle对From子句从右向左的扫描方式，应该把交叉表放在最末尾，然后才是最小表，所以上面的应该这样写

--tableA a 交叉表 
--tabelB b 100w
--tableC c 1w
select count(1) from tableB b ,tableC c ,tableA a where a.id=b.id and a.id=c.id;

这种写法对大数据量会非常有用，大家谨记，也是很常用的。

第二点呢是Where子句后面的条件过滤有讲究，ORACLE对where子句后面的条件过滤是自下向上，从右向左扫描的，所以和From子句一样一样的，把过滤条件排个序，按过滤数据的大小，自然就是最少数据的那个条件写在最下面，最右边，依次类推，例如

--No.1 不可取 性能低下
select * from tableA a where 
a.id>500
and a.lx = '2b'
and a.id < 'select count(1) from tableA  where id=a.id '

--No.2 性能高
select * from tableA a where 
a.id < 'select count(1) from tableA  where id=a.id '
and a.id>500
and a.lx = '2b'

第三点呢估计搞数据库的都知道啦，就是在select的时候少用*，多敲敲键盘，写上字段名吧，因为ORACLE的查询器会把*转换为表的全部列名，这个会浪费时间的，所以在大表中少用。

第四点呢就是要使用rowid 这个很好啊，可以用来分页，删除查询重复记录，很强大的，给两个例子，rownum是用在分页:

下面总结一下几种查找和删除重复记录的方法（以表CZ为例）：

表CZ的结构如下：

SQL> desc cz

            Name Null? Type

            ----------------------------------------- 

             C1 NUMBER(10)

            C10 NUMBER(5)

            C20 VARCHAR2(3)

删除重复记录的方法原理：

(1).在Oracle中，每一条记录都有一个rowid，rowid在整个数据库中是唯一的，rowid确定了每条记录是在Oracle中的哪一个数据文件、块、行上。

(2).在重复的记录中，可能所有列的内容都相同，但rowid不会相同，所以只要确定出重复记录中那些具有最大rowid的就可以了，其余全部删除。

重复记录判断的标准是：

C1,C10和C20这三列的值都相同才算是重复记录。

经查看表CZ总共有16条记录：

SQL>set pagesize 100

SQL>select * from cz;

    C1 C10 C20

 ---------- ---------- ---

     1 2 dsf

     1 2 dsf

     1 2 dsf

     1 2 dsf

     2 3 che

     1 2 dsf

     1 2 dsf

     1 2 dsf

     1 2 dsf

     2 3 che

     2 3 che

     2 3 che

     2 3 che

     3 4 dff

     3 4 dff

     3 4 dff

     4 5 err

     5 3 dar

     6 1 wee

    7 2 zxc

 20 rows selected.

1.查找重复记录的几种方法：

(1).SQL>select * from cz group by c1,c10,c20 having count(*) >1;

          C1 C10 C20

    ---------- ---------- ---

      1 2 dsf

      2 3 che

      3 4 dff

(2).SQL>select distinct * from cz;

            C1 C10 C20

 ---------- ---------- ---

          1 2 dsf

          2 3 che

          3 4 dff

(3).SQL>select * from cz a where rowid=(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20);
C1 C10 C20
---------- ---------- ---
1 2 dsf
2 3 che
3 4 dff

2.删除重复记录的几种方法：

(1).适用于有大量重复记录的情况(在C1,C10和C20列上建有索引的时候，用以下语句效率会很高)：

SQL>delete cz where (c1,c10,c20) in (select c1,c10, c20 from cz group by c1,c10,c20 having count(*)>1) and rowid not in (select min(rowid) from cz group by c1,c10,c20 having count(*)>1);
SQL>delete cz where rowid not in (select min(rowid) from cz group by c1,c10,c20);

(2).适用于有少量重复记录的情况(注意，对于有大量重复记录的情况，用以下语句效率会很低)：

SQL>delete from cz a where a.rowid!=(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20);

SQL>delete from cz a where a.rowid<(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20);
SQL>delete from cz a where rowid <(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20);

(3).适用于有少量重复记录的情况(临时表法)：

SQL>create table test as select distinct * from cz; (建一个临时表test用来存放重复的记录）
SQL>truncate table cz; (清空cz表的数据，但保留cz表的结构）
SQL>insert into cz select * from test; (再将临时表test里的内容反插回来）

(4).适用于有大量重复记录的情况(Exception into 子句法)：

采用alter table 命令中的 Exception into 子句也可以确定出库表中重复的记录。这种方法稍微麻烦一些，为了使用“excepeion into ”子句，必须首先创建 EXCEPTIONS 表。创建该表的 SQL 脚本文件为 utlexcpt.sql 。对于win2000系统和 UNIX 系统， Oracle 存放该文件的位置稍有不同，在win2000系统下，该脚本文件存放在$ORACLE_HOMEOra90rdbmsadmin 目录下；而对于 UNIX 系统，该脚本文件存放在$ORACLE_HOME/rdbms/admin 目录下

体步骤如下：

SQL>@?/rdbms/admin/utlexcpt.sql

            Table created.

            SQL>desc exceptions

            Name Null? Type

            ----------------------------------------- 

            ROW_ID ROWID

            OWNER VARCHAR2(30)

            TABLE_NAME VARCHAR2(30)

            CONSTRAINT VARCHAR2(30)

            SQL>alter table cz add constraint cz_unique unique(c1,c10,c20) exceptions into exceptions; 

            ERROR at line 1:

           ORA-02299: cannot validate (TEST.CZ_UNIQUE) - duplicate keys found

            SQL>create table dups as select * from cz where rowid in (select row_id from exceptions); 

            Table created.

            SQL>select * from dups; 

            C1 C10 C20

           ---------- ---------- ---

            1 2 dsf

            1 2 dsf

           1 2 dsf

            1 2 dsf

            2 3 che

           1 2 dsf

            1 2 dsf

           1 2 dsf

            1 2 dsf

            2 3 che

            2 3 che

            2 3 che

            2 3 che

            3 4 dff

           3 4 dff

           3 4 dff

            16 rows selected.

            SQL>select row_id from exceptions;

            ROW_ID

           ------------------

           AAAHD/AAIAAAADSAAA

           AAAHD/AAIAAAADSAAB

            AAAHD/AAIAAAADSAAC

            AAAHD/AAIAAAADSAAF

            AAAHD/AAIAAAADSAAH

           AAAHD/AAIAAAADSAAI

            AAAHD/AAIAAAADSAAG

            AAAHD/AAIAAAADSAAD

            AAAHD/AAIAAAADSAAE

            AAAHD/AAIAAAADSAAJ

            AAAHD/AAIAAAADSAAK

            AAAHD/AAIAAAADSAAL

           AAAHD/AAIAAAADSAAM

            AAAHD/AAIAAAADSAAN

            AAAHD/AAIAAAADSAAO

            AAAHD/AAIAAAADSAAP

           16 rows selected.

            SQL>delete from cz where rowid in ( select row_id from exceptions);

            16 rows deleted.

            SQL>insert into cz select distinct * from dups;

           3 rows created.

            SQL>select *from cz;

            C1 C10 C20

            ---------- ---------- ---

1 2 dsf

2 3 che

3 4 dff

4 5 err

5 3 dar

6 1 wee

7 2 zxc

7 rows selected.

从结果里可以看到重复记录已经删除。

Oracle查询删除表中重复记录

最高效删除重复记录的方法，使用为例rowid

DELETE FROM EMP E WHERE E.ROWID > (SELECT MIN(X.ROWID) FROM EMP X WHERE X.EMP_NO = E.EMP_NO);

     1、查找表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断
　　select * from people where peopleId in (select   peopleId from   people group by   peopleId having count(peopleId) > 1)
　　2、删除表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断，只留有 rowid最小的记录
　　delete from people where peopleId in (select   peopleId from people group by   peopleId   having count(peopleId) > 1) and rowid not in (select min(rowid) from   people group by peopleId having count(peopleId )>1)
　　注:rowid为oracle自带不用该.....
　　3、查找表中多余的重复记录（多个字段）
　　select * from vitae a where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
　　4、删除表中多余的重复记录（多个字段），只留有rowid最小的记录
　　delete from vitae a where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)　and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)
　　5、查找表中多余的重复记录（多个字段），不包含rowid最小的记录
　　select * from vitae a　where (a.peopleId,a.seq) in   (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)　and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)
　　(二)比方说　在A表中存在一个字段“name”，而且不同记录之间的“name”值有可能会相同，现在就是需要查询出在该表中的各记录之间，“name”值存在重复的项；
　　Select Name,Count(*) From A Group By Name Having Count(*) > 1
　　如果还查性别也相同大则如下:
　　Select Name,sex,Count(*) From A Group By Name,sex Having Count(*) > 1

--分页 start=10 limit=10 --end 为 start + limit select * from ( select A.*,Rownum rn from (select * from tableA order by id) A where rownum <= 20 ) b wehre rn> 10 order by id desc /*解释一下， 1.查询要排列的表 A 2.查询A表的Rownum 找出小于end的数据组成表B 3.查询B表通过rownum找出大于start的数据完成简单的说先根据end值过滤数据，然后在根据start过滤数据 so 简单的 */

第五点是存储过程中需要注意的，多用commit了，既可以释放资源，但是要谨慎啊。

第六点是减少对数据库表的查询，这个很重要，能减少就减少，因为在执行语句的时候oracle会做很多初始工作。

第七点不要用in啦，用exists来代替咯，例如：

--NO.1  IN的写法  
SELECT * FROM TABLEA A WHERE 
A.ID IN 
( SELECT ID FORM TABLEB B WHERE B.ID>1)

--NO.2 exists 写法
SELECT * FROM TABLEA A WHERE
EXISTS (
SELECT 1 FROM TABLEB B WHERE A.ID=B.ID AND B.ID>1)

相同的还有使用not exists 代替 not in ，方法雷同啊，就不介绍了。

那还有一些简单的方法，例如索引这些就比较简单了，就不介绍了，就写在这里吧。

分享到：

（转）Oracle sql 优化2 | （转）join, inner join, left join, righ ...

2012-04-12 22:27
浏览 1510
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）Oracle sql 优化1

Oracle查询删除表中重复记录

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

（转）Oracle sql 优化1

Oracle查询删除表中重复记录

评论

发表评论

相关推荐

mysql之union

(转)in 和 exist

（转）Oracle中的Join

（转）数据库三范式

oracle的分号和斜杠(转）

（转）oracle索引整理

（转）Oracle中的Hash Join祥解

(转)oracle 表连接方式详解

（转）Oracle sql 优化2

（转）join, inner join, left join, right join, full join的区别

（转）ORACLE 正斜杠(/)的作用

[转]oracle的复合索引两个知识点

【转】oracle的LAG和LEAD分析函数

[转]oracle临时表相关知识

Oracle中的rownum(伪列)用法解析

Oracle 取整、四舍五入及格式化 Round/Floor/Ceil

Oracle秒变时间

Oracle时间加减单位时间

（转）in和exists

pl/sql 判断闰年

最近访客更多访客>>