`

oracle中的join

阅读更多

 create   table   dali.test1(a   int,b   int); 
  create   table   dali.test2(a   int,b   int); 
  
  insert   into   dali.test1   values(1,456); 
  insert   into   dali.test1   values(2,427); 
  insert   into   dali.test2   values(1,45456); 
  insert   into   dali.test2   values(3,45656); 
  
  ---内连接 
  select   *   from   dali.test1   a,   dali.test2   b   where   a.a=b.a; 

内连接结果:
    A   B    A  B
1  1  456  1  45456
'----------------------------
   
  ---左连接 
  select   *   from   dali.test1   a,   dali.test2   b   where   a.a=b.a(+); 

左连接结果:
    A    B    A    B
1  1    456  1  45456
2  2    427
'====================
   
  ---右连接 
  select   *   from   dali.test1   a,   dali.test2   b   where   a.a(+)=b.a; 

右连接结果:
    A    B    A    B
1  1   456   1    45456
2               3    45656
'=============================
   
  ---完全连接 
  select   *   from   dali.test1   a,   dali.test2   b   where   a.a=b.a(+) 
  union 
  select   *   from   dali.test1   a,   dali.test2   b   where   a.a(+)=b.a; 
   完全连接结果:
    A    B      A    B
1   1   456     1   45456
2   2   427
3               3   45656
'========================
  ---迪卡尔 
  select   *   from   dali.test1,   dali.test2;

笛卡尔结果:
    A    B    A    B
1  1   456   1   45456
2  2   427   1   45456
3  1   456   3   45656
4  2   427   3   45656

 

 

 

 

基本概念

    Nested loop join:

    Outer table中的每一行与inner table中的相应记录join,类似一个嵌套的循环。

    Sort merge join:

    将两个表排序,然后再进行join。

    Hash join:

    将两个表中较小的一个在内存中构造一个Hash 表(对Join Key),扫描另一个表,同样对Join Key进行Hash后探测是否可以join,找出与之匹配的行。

    一张小表被hash在内存中。因为数据量小,所以这张小表的大多数数据已经驻入在内存中,剩下的少量数据被放置在临时表空间中;

    每读取大表的一条记录,就和小表中内存中的数据进行比较,如果符合,则立即输出数据(也就是说没有读取临时表空间中的小表的数据)。而如果大表的数据与小表中临时表空间的数据相符合,则不直接输出,而是也被存储临时表空间中。

    当大表的所有数据都读取完毕,将临时表空间中的数据以其输出。如果小表的数据量足够小(小于hash area size),那所有数据就都在内存中了,可以避免对临时表空间的读写。

    如果是并行环境下,前面中的第2步就变成如下了:每读取一条大表的记录,和内存中小表的数据比较,如果符合先做join,而不直接输出,直到整张大表数据读取完毕。如果内存足够,Join好的数据就保存在内存中。否则,就保存在临时表空间中。

    适用范围

    Nested loop join:

    适用于outer table(有的地方叫Master table)的记录集比较少(<10000)而且inner table(有的地方叫Detail table)索引选择性较好的情况下(inner table要有index)。

    inner table被outer table驱动,outer table返回的每一行都要在inner table中检索到与之匹配的行。当然也可以用ORDERED 提示来改变CBO默认的驱动表,使用USE_NL(table_name1 table_name2)可是强制CBO 执行嵌套循环连接。

    cost = outer access cost + (inner access cost * outer cardinality)

    Sort merge join:

    用在数据没有索引但是已经排序的情况下。

    通常情况下hash join的效果都比Sort merge join要好,然而如果行源已经被排过序,在执行排序合并连接时不需要再排序了,这时Sort merge join的性能会优于hash join。可以使用USE_MERGE(table_name1 table_name2)来强制使用Sort merge join。
cost = (outer access cost * # of hash partitions) + inner access cost

    Hash join:

    适用于两个表的数据量差别很大。但需要注意的是:如果HASH表太大,无法一次构造在内存中,则分成若干个partition,写入磁盘的temporary segment,则会多一个I/O的代价,会降低效率,此时需要有较大的temporary segment从而尽量提高I/O的性能。

    可以用USE_HASH(table_name1 table_name2)提示来强制使用散列连接。如果使用散列连HASH_AREA_SIZE 初始化参数必须足够的大,如果是9i,Oracle建议使用SQL工作区自动管理,设置WORKAREA_SIZE_POLICY 为AUTO,然后调整PGA_AGGREGATE_TARGET 即可。

    也可以使用HASH_JOIN_ENABLED=FALSE(默认为TRUE)强制不使用hash join。

    cost = (outer access cost * # of hash partitions) + inner access cost

    效率比较

    Hash join的主要资源消耗在于CPU(在内存中创建临时的hash表,并进行hash计算),而merge join的资源消耗主要在于磁盘I/O(扫描表或索引)。在并行系统中,hash join对CPU的消耗更加明显。所以在CPU紧张时,最好限制使用hash join。

    在绝大多数情况下,hash join效率比其他join方式效率更高:

    在Sort-Merge Join(SMJ),两张表的数据都需要先做排序,然后做merge。因此效率相对最差;
Nested-Loop Join(NL)效率比SMJ更高。特别是当驱动表的数据量很大(集的势高)时。这样可以并行扫描内表。
    Hash join效率最高,因为只要对两张表扫描一次。

 

 

-------------------加sort merge提示-----------------------------
SQL> select/*+ use_merge(a,b)*/* from tab1 a,tab2 b where a.empno=b.empno;

 

-------------------加hash join提示-----------------------------
SQL> select/*+ use_nl(a,b)*/* from tab1 a,tab2 b where a.empno=b.empno;
200000 rows selected.

分享到:
评论

相关推荐

    oracle-join用法

    在Oracle SQL中,Join主要分为几个类型,包括INNER JOIN、LEFT JOIN (LEFT OUTER JOIN)、RIGHT JOIN (RIGHT OUTER JOIN)以及FULL JOIN (FULL OUTER JOIN)。这些类型在Java编程中同样可以使用,通过SQL查询语句来实现...

    Oracle CBO 学习笔记之(1) : 深入理解Oracle Hash Join的代价模型及其执行流程

    在这个学习笔记中,我们将深入探讨Oracle中的Hash Join操作,这是一种重要的联接(JOIN)类型,尤其在处理大数据量时能展现高效的性能。 Hash Join的基本原理是通过构建一个哈希表来实现两个表的连接。首先,Oracle...

    oracle 连接 join at

    在Oracle数据库中,连接(JOIN)是用于合并两个或多个表的数据的关键操作。当我们需要从相关的表中获取信息时,JOIN语句就显得尤为重要。在本文中,我们将深入探讨Oracle JOIN的操作及其在实际应用中的重要性。 ...

    oracle性能优化技巧

    在Oracle数据库中,优化器是决定查询执行计划的关键组件,其目标是最小化资源消耗并最大化查询性能。Oracle提供了三种主要的优化器模式:基于规则(RULE)、基于成本(COST)以及选择性(CHOOSE)。 1. **基于规则...

    python+oracle join

    python+oracle join

    Oracle中hash join研究.pdf

    哈希连接(Hash Join)是Oracle数据库中的一种高效连接方法,主要针对等值连接操作,其引入旨在解决嵌套循环连接(Nested Loop Join)中的大量随机读取问题以及排序合并连接(Sort-Merge Join)中的排序成本过高问题...

    oracle中left join和right join的区别浅谈

    在Oracle数据库中,JOIN操作是用于合并两个或更多表中的数据行,以便基于它们之间的相关列获取结果集。LEFT JOIN(也称为LEFT OUTER JOIN)和RIGHT JOIN(也称为RIGHT OUTER JOIN)是两种特殊的JOIN类型,它们在处理...

    深入Oracle的left join中on和where的区别详解

    在LEFT JOIN中,ON条件用于确定哪些左表的记录与右表的记录相关联。例如,假设我们有两张表,表1(tab1)和表2(tab2),我们可以执行以下查询: 1. `SELECT * FROM tab1 LEFT JOIN tab2 ON (tab1.size = tab2.size...

    理解oracle中的外连接

    在Oracle数据库系统中,外连接(Outer Join)是一种高级的SQL联接操作,它扩展了标准的内连接(Inner Join)概念,允许我们查询不匹配的数据。外连接分为三种类型:左外连接(Left Outer Join)、右外连接(Right ...

    left-right-join.zip_join_oracle

    本主题主要聚焦于Oracle中的两种特殊连接方式:左外连接(LEFT JOIN)和右外连接(RIGHT JOIN)。通过深入理解这两种连接类型,我们可以更好地进行数据融合,获取更全面的信息。 首先,让我们从基本概念出发。在SQL...

    Oracle中hint的理解篇

    ### Oracle中Hint的理解与应用 #### 一、Hint概述 在Oracle数据库中,Hint是一种用于指导优化器如何生成执行计划的特殊语法。当基于代价的优化器(Cost-Based Optimizer, CBO)未能选择出最优的执行计划时,可以...

    Oracle数据库3种主要表连接方式对比

    在Oracle数据库中,为了获取来自多个表的数据,我们需要使用不同的连接方式来实现这一目的。本文将详细介绍三种主要的表连接方式:嵌套循环连接(Nested Loop Join,简称NL Join)、排序合并连接(Sort Merge Join,...

    Oracle11g中文文档

    10. **数据仓库和OLAP**:Oracle11g支持构建数据仓库,利用星型和雪花型模式,以及物质化视图、分区、物化 join 来提高分析查询性能。Oracle OLAP提供多维数据处理和分析功能。 这些只是Oracle11g众多特性和功能的...

    oracle中文手册合集(8个CHM)

    5. **Oracle函数大全.chm** 和 **Oracle函数手册.chm** - 这两个文件详尽地介绍了Oracle数据库中的内置函数,包括数学函数、字符串函数、日期时间函数、系统信息函数等,为编写复杂的SQL查询和存储过程提供了有力...

    Oracle 中HINT的使用

    Oracle中的HINT是一种非常强大的工具,它允许数据库管理员和开发人员通过在SQL语句中添加特定的指令来指导Oracle查询优化器如何执行查询。这些HINTs提供了对默认查询优化过程的控制,可以帮助解决复杂的查询性能问题...

    Oracle中SQL语句执行效率的查找与解决

    - **连接操作**:Oracle支持多种连接算法,包括嵌套循环连接(Nested Loops)、排序合并连接(Sort-Merge Join)和哈希连接(Hash Join)。每种算法有其优缺点,应根据数据量大小、数据分布情况和可用内存等因素选择...

    OracleHashJoin算法原理分享.pdf

    在Hash Join中,首先将较小的数据源(称为build input,如表S)构建为一个内存中的哈希表。如果哈希表可以完全存储在内存的hash area中,那么这是最理想的情况。然而,如果内存不足以容纳整个哈希表,Oracle会进行...

    Oracle中表的连接及其调整.

    本文将深入探讨 Oracle 中的三种主要连接方式:嵌套循环连接(Nested Loop)、排序合并连接(Sort Merge)和哈希连接(Hash Join),并结合案例分析其工作原理和优化策略。 1. 嵌套循环连接(Nested Loop) 嵌套...

Global site tag (gtag.js) - Google Analytics