`

浅谈Oracle中的三种Join方法

阅读更多

基本概念

Nested loop join:

Outer table中的每一行与inner table中的相应记录join,类似一个嵌套的循环。

Sort merge join:

将两个表排序,然后再进行join。

Hash join:

将两个表中较小的一个在内存中构造一个Hash 表(对Join Key),扫描另一个表,同样对Join Key进行Hash后探测是否可以join,找出与之匹配的行。

一张小表被hash在内存中。因为数据量小,所以这张小表的大多数数据已经驻入在内存中,剩下的少量数据被放置在临时表空间中;

每读取大表的一条记录,就和小表中内存中的数据进行比较,如果符合,则立即输出数据(也就是说没有读取临时表空间中的小表的数据)。而如果大表的数据与小表中临时表空间的数据相符合,则不直接输出,而是也被存储临时表空间中。

当大表的所有数据都读取完毕,将临时表空间中的数据以其输出。如果小表的数据量足够小(小于hash area size),那所有数据就都在内存中了,可以避免对临时表空间的读写。

如果是并行环境下,前面中的第2步就变成如下了:每读取一条大表的记录,和内存中小表的数据比较,如果符合先做join,而不直接输出,直到整张大表数据读取完毕。如果内存足够,Join好的数据就保存在内存中。否则,就保存在临时表空间中。

适用范围

Nested loop join:

适用于outer table(有的地方叫Master table)的记录集比较少(<10000)而且inner table(有的地方叫Detail table)索引选择性较好的情况下(inner table要有index)。

inner table被outer table驱动,outer table返回的每一行都要在inner table中检索到与之匹配的行。当然也可以用ORDERED 提示来改变CBO默认的驱动表,使用USE_NL(table_name1 table_name2)可是强制CBO 执行嵌套循环连接。

cost  = outer access cost + (inner access cost * outer cardinality)

Sort merge join:

用在数据没有索引但是已经排序的情况下。

通常情况下hash join的效果都比Sort merge join要好,然而如果行源已经被排过序,在执行排序合并连接时不需要再排序了,这时Sort merge join的性能会优于hash join。可以使用USE_MERGE(table_name1 table_name2)来强制使用Sort merge join。
cost = (outer access cost * # of hash partitions) + inner access cost

Hash join:

适用于两个表的数据量差别很大。但需要注意的是:如果HASH表太大,无法一次构造在内存中,则分成若干个partition,写入磁盘的temporary segment,则会多一个I/O的代价,会降低效率,此时需要有较大的temporary segment从而尽量提高I/O的性能。

可以用USE_HASH(table_name1 table_name2)提示来强制使用散列连接。如果使用散列连HASH_AREA_SIZE 初始化参数必须足够的大,如果是9i,Oracle建议使用SQL工作区自动管理,设置WORKAREA_SIZE_POLICY 为AUTO,然后调整PGA_AGGREGATE_TARGET 即可。

也可以使用HASH_JOIN_ENABLED=FALSE(默认为TRUE)强制不使用hash join。

cost = (outer access cost * # of hash partitions) + inner access cost

效率比较

Hash join的主要资源消耗在于CPU(在内存中创建临时的hash表,并进行hash计算),而merge join的资源消耗主要在于磁盘I/O(扫描表或索引)。在并行系统中,hash join对CPU的消耗更加明显。所以在CPU紧张时,最好限制使用hash join。

在绝大多数情况下,hash join效率比其他join方式效率更高:

在Sort-Merge Join(SMJ),两张表的数据都需要先做排序,然后做merge。因此效率相对最差;
Nested-Loop Join(NL)效率比SMJ更高。特别是当驱动表的数据量很大(集的势高)时。这样可以并行扫描内表。
Hash join效率最高,因为只要对两张表扫描一次。

分享到:
评论

相关推荐

    浅谈oracle xml publisher 功能与使用

    #### 三、Oracle XML Publisher的主要功能和使用方法 ##### 1. Oracle XML Publisher的安装及配置 安装过程比较简单,但需要注意以下几点: - **Java配置**:确保已安装Java Runtime Environment (JRE),因为XML ...

    浅谈Oracle中索引的使用.pdf

    浅谈Oracle中索引的使用.pdf

    浅谈Oracle优化排序的操作

    ### 浅谈Oracle优化排序的操作 #### 概念与机制 在探讨Oracle排序操作的优化之前,我们首先需要理解Oracle数据库中的排序是如何发生的以及它所依赖的资源。Oracle的排序操作通常发生在以下几种情况下:创建索引、...

    浅谈Oracle数据库DBVERIFY工具的使用方法.pdf

    浅谈Oracle数据库DBVERIFY工具的使用方法.pdf

    浅谈ORACLE高水位线的解决方法.pdf

    浅谈ORACLE高水位线的解决方法.pdf

    oracle-join用法

    Oracle Join是数据库操作中一种非常重要的技术,用于合并多个表的数据。在Oracle SQL中,Join主要分为几个类型,包括INNER JOIN、LEFT JOIN (LEFT OUTER JOIN)、RIGHT JOIN (RIGHT OUTER JOIN)以及FULL JOIN (FULL ...

    浅谈Delphi7.0连接Oracle数据库的三种方式.pdf

    浅谈Delphi7.0连接Oracle数据库的三种方式 Delphi是Borland公司开发的一款功能强大的集成开发环境(IDE),它支持多种编程语言,包括Object Pascal、C++和Java等。Delphi7.0是Delphi的一個版本,它具有强大的数据库...

    浅谈ORACLE数据库RAC集群备份.pdf

    浅谈ORACLE数据库RAC集群备份.pdf

    浅谈Oracle常见错误处理

    这是Oracle内部错误的一种,表示Oracle在执行过程中遇到了无法恢复的问题。对于此类错误的处理,文档提供了设置多个事件的方法。在参数文件中可以通过两种方式设置跟踪事件:使用连续的多行event,或者使用冒号(:)...

    浅谈Oracle数据库性能的优化

    ### 浅谈Oracle数据库性能的优化 #### 一、引言 随着信息技术的快速发展和企业对数据处理需求的增加,数据库作为数据管理的核心组件,在企业的信息化建设中扮演着至关重要的角色。Oracle数据库作为全球最广泛使用...

    Oracle_RAC原理浅谈.ppt

    Oracle_RAC原理浅谈.ppt 比较详细的文档

    C# oracle三种连接方法

    "oracle连接测试"可能是一些测试连接数据库的代码片段,而"ShowDemo"可能是一个完整的演示应用程序,展示如何使用这三种方法中的任意一种来连接并操作Oracle数据库。这些资源对于学习和实践C#连接Oracle数据库非常有...

    浅谈Oracle数据库安全管理.pdf

    浅谈Oracle数据库安全管理.pdf

    浅谈ORACLE数据库中的SQL优化原理与应用.pdf

    浅谈ORACLE数据库中的SQL优化原理与应用.pdf

    Oracle的三种表连接方式

    Oracle 的三种表连接方式是指在做表 join 的时候, Oracle 有三种方式,分别是:sort merge join(SMJ) ·nest loop(NL) ·hash join(HJ)。下面是对这三种策略的详细讲解: sort merge join(SMJ) sort merge join ...

    打包oracle客户端的两种方法

    "打包 Oracle 客户端的两种方法" 在软件开发和数据库管理中,Oracle 客户端是非常重要的组件,然而在实际应用中,如何将 Oracle 客户端打包到安装程序中是一件非常重要的事情。本文将介绍两种方法来打包 Oracle ...

    浅谈Oracle数据库的性能调优.pdf

    浅谈Oracle数据库的性能调优.pdf

    浅谈ORACLE数据库安全管理策略.pdf

    浅谈ORACLE数据库安全管理策略.pdf

    Oracle数据库3种主要表连接方式对比

    本文将详细介绍三种主要的表连接方式:嵌套循环连接(Nested Loop Join,简称NL Join)、排序合并连接(Sort Merge Join,简称SM Join)以及散列连接(Hash Join)。我们将探讨它们的特点、优势与劣势,以便于在实际...

Global site tag (gtag.js) - Google Analytics