`
tooby
  • 浏览: 118654 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Oracle Parallel 多线程

 
阅读更多

对于一个大的任务,一般的做法是利用一个进程,串行的执行,如果系统资源足够,可以采用parallel技术,把一个大的任务分成若干个小的任务,同时启用n个进程/线程,并行的处理这些小的任务,这些并发的进程称为并行执行服务器(parallel executeion server),这些并发进程由一个称为并发协调进程的进程来管理。

启用Parallel前的忠告:只有在需要处理一个很大的任务,如需要几十分钟,几个小时的作业中,并且要有足够的系统资源的情况下(这些资源包括cpu,内存,io),您才应该考虑使用parallel。否则,在一个多并发用户下,系统本身资源负担已经很大的情况下,启用parallel,将会导致某一个会话试图占用了所有的资源,其他会话不得不去等待,从而导致系统系能反而下降的情况,一般情况下,oltp系统不要使用parallel,oltp系统中可以考虑去使用。

 

Parallel分类

l  并行查询parallel query

l  并行dml parallel dml pdml

l  并行ddl parallel ddl pddl

 

一、 并行查询

并行查询允许将一个sql select语句划分为多个较小的查询,每个部分的查询并发地运行,然后将各个部分的结果组合起来,提供最终的结果,多用于全表扫描,索引全扫描等,大表的扫描和连接、创建大的索引、分区索引扫描、大批量插入更新和删除

 

1.    启用并行查询

SQL> ALTER TABLE T1 PARALLEL;

告知oracle,对T1启用parallel查询,但并行度要参照系统的资源负载状况来确定。

利用hints提示,启用并行,同时也可以告知明确的并行度,否则oracle自行决定启用的并行度,这些提示只对该sql语句有效。

SQL> select /*+ parallel(t1 8) */ count(*)from t1;

 

SQL> select degree from user_tables where table_name='T1';

DEGREE

--------------------

  DEFAULT

 

并行度为Default,其值由下面2个参数决定

SQL> show parameter cpu

 

NAME                                TYPE       VALUE

----------------------------------------------- ------------------------------

cpu_count                           integer    2

parallel_threads_per_cpu            integer    2

 

cpu_count表示cpu数

parallel_threads_per_cpu表示每个cpu允许的并行进程数

default情况下,并行数为cpu_count*parallel_threads_per_cpu

 

2.    取消并行设置

SQL> alter table t1 noparallel;

SQL> select degree from user_tables wheretable_name='T1';

 

DEGREE

----------------------------------------

        1

 

3.    数据字典视图

v$px_session

sid:各个并行会话的sid

qcsid:query coordinator sid,查询协调器sid

 

二、 并行dml

并行dml包括insert,update,delete,merge,在pdml期间,oracle可以使用多个并行执行服务器来执行insert,update,delete,merge,多个会话同时执行,同时每个会话(并发进程)都有自己的undo段,都是独立的一个事务,这些事务要么由pdml协调器进程提交,要么都rollback。

在一个有充足I/o带宽的多cpu主机中,对于大规模的dml,速度可能会有很大的提升,尤其是在大型的数据仓库环境中。

并行dml需要显示的启用

SQL> alter session enable parallel dml;

 

Disable并行dml

SQL> alter session disable parallel dml;

 

三、 并行ddl

并行ddl提供了dba使用全部机器资源的能力,常用的pddl有

create table as select ……

create index

alter index rebuild

alter table move

alter table split

在这些sql语句后面加上parallel子句

SQL> alter table t1 move parallel;

Table altered

SQL> create index T1_IDX on T1 (OWNER,OBJECT_TYPE)

 2   tablespace SYSTEM

3        parallel;

4        ;


1.  用途

强行启用并行度来执行当前SQL。这个在Oracle 9i之后的版本可以使用,之前的版本现在没有环境进行测试。也就是说,加上这个说明,可以强行启用Oracle的多线程处理功能。举例的话,就像电脑装了多核的CPU,但大多情况下都不会完全多核同时启用(2核以上的比较明显),使用parallel说明,就会多核同时工作,来提高效率。

但本身启动这个功能,也是要消耗资源与性能的。所有,一般都会在返回记录数大于100万时使用,效果也会比较明显。

2.  语法

/*+parallel(table_short_name,cash_number)*/

这个可以加到insert、delete、update、select的后面来使用(和rule的用法差不多,有机会再分享rule的用法)

开启parallel功能的语句是:

alter session enable parallel dml;

这个语句是DML语句哦,如果在程序中用,用execute的方法打开。

3.  实例说明

用ERP中的transaction来说明下吧。这个table记录了所有的transaction,而且每天数据量也算相对比较大的(根据企业自身业务量而定)。假设我们现在要查看对比去年一年当中每月的进、销情况,所以,一般都会写成:

select to_char(transaction_date,'yyyymm') txn_month,

       sum(

        decode(

            sign(transaction_quantity),1,transaction_quantity,0
              )

          ) in_qty,

       sum(

        decode(

            sign(transaction_quantity),-1,transaction_quantity,0
              )

          ) out_qty

  from mtl_material_transactions mmt

 where transaction_date >= add_months(

                            to_date(    

                                to_char(sysdate,'yyyy')||'0101','yyyymmdd'),

                                -12)

   and transaction_date <= add_months(

                            to_date(

                                to_char(sysdate,'yyyy')||'1231','yyyymmdd'),

                                -12)

group by to_char(transaction_date,'yyyymm') 

这个SQL执行起来,如果transaction_date上面有加index的话,效率还算过的去;但如果没有加index的话,估计就会半个小时内都执行不出来。这是就可以在select 后面加上parallel说明。例如:
select /*+parallel(mmt,10)*/
       to_char(transaction_date,'yyyymm') txn_month,

...

 

这样的话,会大大提高执行效率。如果要将检索出来的结果insert到另一个表tmp_count_tab的话,也可以写成:
insert /*+parallel(t,10)*/
  into tmp_count_tab

(

    txn_month,

    in_qty,

    out_qty

)

select /*+parallel(mmt,10)*/
       to_char(transaction_date,'yyyymm') txn_month,

...

 

插入的机制和检索机制差不多,所以,在insert后面加parallel也会加速的。关于insert机制,这里暂不说了。
Parallel后面的数字,越大,执行效率越高。不过,貌似跟server的配置还有oracle的配置有关,增大到一定值,效果就不明显了。所以,一般用8,10,12,16的比较常见。我试过用30,发现和16的效果一样。不过,数值越大,占用的资源也会相对增大的。如果是在一些package、function or procedure中写的话,还是不要写那么大,免得占用太多资源被DBA开K。
  

4.  Parallel也可以用于多表

多表的话,就是在第一后面,加入其他的就可以了。具体写法如下:

/*+parallel(t,10) (b,10)*/

5.  小结

关于执行效率,建议还是多按照index的方法来提高效果。Oracle有自带的explan road的方法,在执行之前,先看下执行计划路线,对写好的SQL tuned之后再执行。实在没办法了,再用parallel方法。Parallel比较邪恶,对开发者而言,不是好东西,会养成不好习惯,导致很多bad SQL不会暴漏,SQL Tuning的能力得不到提升。我有见过某些人create table后,从不create index或primary key,认为写SQL时加parallel就可以了。
分享到:
评论

相关推荐

    Oracle Parallel 并行处理

    描述:在Oracle数据库中,通过并行处理技术,一个SQL语句可以被多个线程或进程同时处理,从而显著提升执行效率。 ### Oracle并行处理技术概述 Oracle并行处理是Oracle企业版提供的一项强大功能,它允许将SQL语句的...

    oracle的Parallel_并行技术案例详解

    Oracle 的 Parallel 并行技术是指在数据库系统中实现并行处理的技术,通过将一个大的任务分解成多个小的任务,并利用多个进程或线程来并发执行这些小任务,从而提高系统的处理速度和效率。 在 Oracle 中,Parallel ...

    oracle parallel SQL

    在 Oracle 中,可以通过一些提示(hint)来控制并行执行,如使用“parallel”提示来指定查询并行执行时应该使用的线程数。同时,还有一些数据库配置参数可以控制并行操作的各个方面,比如系统级别的并行处理的限制,...

    Oracle Parallel SQL

    通过并行处理,一个SQL语句可以在多个线程或进程中同时执行,充分利用多核处理器和多磁盘设备的能力,从而显著提升查询性能。在没有并行技术的情况下,SQL语句通常是顺序执行的,这意味着一次只会使用一个CPU或磁盘...

    python 多线程串行和并行的实例

    ### Python多线程串行与并行实例解析 在Python编程中,多线程是一种常见的技术,用于提高程序执行效率,特别是在处理I/O密集型任务时。本文将深入探讨一个具体的Python多线程实例,该实例展示了如何在Python中实现...

    oracle线程测试

    Oracle并行执行(Parallel Execution)机制允许数据库将一个大的操作分解为多个小任务,这些任务可以在不同的处理器上同时运行,从而显著提升性能。线程是并行执行的基础,每个并行服务器进程(PX Process)都有一个...

    Oracle_数据库中的海量数据处理

    2. **并行处理(Parallel Processing)**:通过多线程或多进程技术同时执行多个任务,显著提升数据处理速度。 3. **物化视图(Materialized Views)**:预先计算好复杂查询的结果并将其存储为物理表,从而大幅减少...

    Oracle实用大全

    - **多线程架构**:Oracle数据库采用多线程并行执行(Parallel Query)机制,将大型查询分解为多个任务并行处理,显著提高查询速度。 - **锁定机制**:Oracle使用行级锁定,减少并发操作中的冲突,提高系统吞吐量...

    oracle标准语法速查表

    - **定义**:多线程服务器、电路、共享服务器、调度程序等相关信息。 - **用途**:管理和监控并发连接。 ##### 31. v$queue, v$lock, v$enqueue_lock, v$locked_object, v$global_blocked_locks - **定义**:队列、...

    oracle sql 语句暗示 hints

    对于大量数据处理任务,通过设置 **`/*+ PARALLEL (表名 线程数) */`**,可以在多线程环境下并行处理数据,显著提高查询速度。 #### 四、监控与调优 PL/SQL 在 PL/SQL 程序开发中,除了合理运用 SQL 暗示外,还...

    ORACLE 动态性能视图详解

    在OPS(Oracle Parallel Server)环境中,`GV$`视图可以用来查询OPS_ADMIN_GROUP参数定义的实例组信息,但需要满足`PARALLEL_MAX_SERVERS`参数大于零,并且OPS_ADMIN_GROUP参数至少有一个成员。 访问动态性能视图...

    ORACLE并行SQL指南

    并行SQL通过允许多个进程或线程同时处理SQL语句的不同部分,从而提高了SQL语句的执行速度和整个系统的响应时间。 #### 二、并行SQL的优势 1. **提高处理能力**:并行执行可以让单个SQL语句利用多个CPU和磁盘设备的...

    Oracle并行执行

    4. **`PARALLEL_THREADS_PER_CPU`**:指定每颗CPU上运行的并行线程数。合理配置此参数可以帮助平衡CPU负载。 #### 五、一般参数调整 除了上述特定于并行执行的参数外,还需要关注其他一些通用参数: 1. **`CPU_...

    oracle 性能oracle 性能oracle 性能oracle 性能

    3. PARALLEL_ADAPTIVE_MULTI_USER:当设置为TRUE时,Oracle将启用一个自适应算法,动态调整并行执行的度量,以适应多用户环境下的系统负载。 4. PARALLEL_AUTOMATIC_ENABLED:若设置为TRUE,Oracle将自动决定并行...

    Parallel execution 并行查询的性能测试

    - **CPU**:Intel i7 2630QM,四核心八线程 - **数据库版本**:Oracle 11.2.0.1 - **内存目标**:1.6GB 这些硬件与软件配置共同决定了测试的基础条件。 #### 什么是并行执行 并行执行是一种通过多CPU和I/O资源来...

    日积月累-oracle笔记

    2. **并行插入**:通过指定`/*+PARALLEL(表名, 并行度)*/`,可以利用多线程并行加载数据,进一步提升性能。并行度应根据系统资源和数据量合理设置。 3. **SQL*Loader工具**:SQL*Loader是Oracle提供的一个强大工具...

    oracle并行查询优化

    在Oracle数据库系统中,并行查询(Parallel Query, PQ)是一项强大的特性,它通过将查询任务分解为多个子任务并行执行来提升性能。然而,并行查询并非总是能带来性能提升,其效果取决于多种因素。本文将详细介绍如何...

    Oracle Database 12c 完全参考手册(第7版)源码

    而并行执行(Parallel Execution)特性则通过多线程并行处理大数据量操作,显著提升了处理速度。 除此之外,Oracle 12c 还包含了如PL/SQL编程、数据库触发器、存储过程、索引策略、物化视图、数据库链接等大量高级...

Global site tag (gtag.js) - Google Analytics