`

Oracle Dimension 上

阅读更多

在数据仓库环境中,我们通常利用物化视图强大的查询重写功能来提升统计查询的性能,但是物化视图的查询重写功能有时候无法智能地判断查询中一些相关联的条件,以至于影响性能。比如我们有一张销售表sales,用于存储订单的详细信息,包含交易日期、顾客编号和销售量。我们创建一张物化视图,按月存储累计销量信息,假如这时候我们要查询按季度或者按年度统计销量信息,Oracle是否能够智能地转换查询重写呢?我们知道交易日期中的日期意味着月,月意味着所处的季度,季度意味着年度,但是Oracle却是无法智能地判断这其中的关系,因此无法利用物化视图查询重写来返回我们季度或年度的销量信息,而是直接查询基表,导致性能产生问题。

这时候Dimension就派上用场了。Dimension用于说明列之间的父子对应关系,以使优化器能够自动转换不同列的关系,利用物化视图的查询功能来提升查询统计性能。下面我们首先创建一张销售交易表sales,包含交易日期、顾客编号和销售量这几个列,用于保存销售订单信息,整个表有42万多条记录;创建另一张表time_hierarchy用于存储交易日期中时间的关系,包含交易日期及其对应的月、季度及年度等信息,然后我们将体验Dimension的强大功能。

Roby@XUE> create table sales

2 (trans_date date, cust_id int, sales_amount number );

Table created.

Roby@XUE> insert /*+ APPEND */ into sales

2 select trunc(sysdate,'year')+mod(rownum,366) TRANS_DATE,

3 mod(rownum,100) CUST_ID,

4 abs(dbms_random.random)/100 SALES_AMOUNT

5 from all_objects

6 /

5926 rows created.

Roby@XUE> commit;

Commit complete.

Roby@XUE> begin

2 for i in 1 .. 6

3 loop

4 insert /*+ APPEND */ into sales

5 select trans_date, cust_id, abs(dbms_random.random)/100 SALES_AMOUNT

6 from sales;

7 commit;

8 end loop;

9 end;

10 /

PL/SQL procedure successfully completed.

Roby@XUE> select count(*) from sales;

COUNT(*)

----------

426672

创建索引组织表time_hierarchy,里面生成了交易日期中日期DAY、月MMYYYY、季度QTY_YYYY、年度YYYY的关系。

Roby@XUE> create table time_hierarchy

2 (day primary key, mmyyyy, mon_yyyy, qtr_yyyy, yyyy)

3 organization index

4 as

5 select distinct

6 trans_date DAY,

7 cast (to_char(trans_date,'mmyyyy') as number) MMYYYY,

8 to_char(trans_date,'mon-yyyy') MON_YYYY,

9 'Q' || ceil( to_char(trans_date,'mm')/3) || ' FY'

10 || to_char(trans_date,'yyyy') QTR_YYYY,

11 cast( to_char( trans_date, 'yyyy' ) as number ) YYYY

12 from sales

13 /

Table created.

接下我们创建一张物化视图mv_sales,用于存储每个客户对应每个月的销量统计信息。

Roby@XUE> create materialized view mv_sales

2 build immediate

3 refresh on demand

4 enable query rewrite

5 as

6 select sales.cust_id, sum(sales.sales_amount) sales_amount,

7 time_hierarchy.mmyyyy

8 from sales, time_hierarchy

9 where sales.trans_date = time_hierarchy.day

10 group by sales.cust_id, time_hierarchy.mmyyyy

11 /

Materialized view created.

 

我们对基表进行分析,以使优化器能够物化视图的查询重写功能:

Roby@XUE> analyze table sales compute statistics;

Table analyzed.

Roby@XUE> analyze table time_hierarchy compute statistics;

Table analyzed.

设置会话的查询重写功能:

Roby@XUE> alter session set query_rewrite_enabled=true;

Session altered.

Roby@XUE> alter session set query_rewrite_integrity=trusted;

Session altered.

接下来我们按月统计总的销量:

Roby@XUE> select time_hierarchy.mmyyyy, sum(sales_amount)

2 from sales, time_hierarchy

3 where sales.trans_date = time_hierarchy.day

4 group by time_hierarchy.mmyyyy

5 /

MMYYYY SUM(SALES_AMOUNT)

---------- -----------------

12006 4.0574E+11

12007 1.2297E+10

22006 3.6875E+11

32006 3.9507E+11

42006 3.7621E+11

52006 3.8549E+11

62006 3.6641E+11

72006 3.8110E+11

82006 3.8502E+11

92006 3.7278E+11

102006 3.7983E+11

112006 3.7210E+11

122006 3.8364E+11

13 rows selected.

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=4 Card=327 Bytes=8502)

1 0 SORT (GROUP BY) (Cost=4 Card=327 Bytes=8502)

2 1 TABLE ACCESS (FULL) OF 'MV_SALES' (Cost=2 Card=327 Bytes=8502)

Statistics

----------------------------------------------------------

17 recursive calls

0 db block gets

25 consistent gets

4 physical reads

我们可以看到查询使用了查询重写的功能,直接查询物化视图中的查询方案,而不是查询其表,逻辑IO只有25个,性能相当良好。

假如这时候我们要按季度来查询统计销量信息,结果又会是怎样呢?

Roby@XUE> select time_hierarchy.qtr_yyyy, sum(sales_amount)

2 from sales, time_hierarchy

3 where sales.trans_date = time_hierarchy.day

4 group by time_hierarchy.qtr_yyyy

5 /

QTR_YYYY SUM(SALES_AMOUNT)

------------------------------------------------ -----------------

Q1 FY2006 1.1696E+12

Q1 FY2007 1.2297E+10

Q2 FY2006 1.1281E+12

Q3 FY2006 1.1389E+12

Q4 FY2006 1.1356E+12

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=1681 Card=5 Bytes=145)

1 0 SORT (GROUP BY) (Cost=1681 Card=5 Bytes=145)

2 1 NESTED LOOPS (Cost=35 Card=426672 Bytes=12373488)

3 2 TABLE ACCESS (FULL) OF 'SALES' (Cost=35 Card=426672

4 2 INDEX (UNIQUE SCAN) OF 'SYS_IOT_TOP_7828' (UNIQUE)

Statistics

----------------------------------------------------------

14 recursive calls

0 db block gets

428048 consistent gets

599 physical reads

可以看到查询将直接查询基表产生了将近428048个逻辑IO,性能无法满足需求。

接下我们创建一个Dimensiontime_hierarchy_dim,用于提醒优化器time_hierarchy表中的DAY列暗示着MMYYYYMMYYYY又意味着QTY_YYYYQTY_YYYY又意味着YYYY。然后我们将重新运行上面那个查询,看执行计划发生了怎样的变更。

Roby@XUE> create dimension time_hierarchy_dim

2 level day is time_hierarchy.day

3 level mmyyyy is time_hierarchy.mmyyyy

4 level qtr_yyyy is time_hierarchy.qtr_yyyy

5 level yyyy is time_hierarchy.yyyy

6 hierarchy time_rollup

7 (

8 day child of

9 mmyyyy child of

10 qtr_yyyy child of

11 yyyy

12 )

13 attribute mmyyyy

14 determines mon_yyyy;

Dimension created.

Roby@XUE> select time_hierarchy.qtr_yyyy, sum(sales_amount)

2 from sales, time_hierarchy

3 where sales.trans_date = time_hierarchy.day

4 group by time_hierarchy.qtr_yyyy

5 /

QTR_YYYY SUM(SALES_AMOUNT)

------------------------------------------------ -----------------

Q1 FY2006 1.1696E+12

Q1 FY2007 1.2297E+10

Q2 FY2006 1.1281E+12

Q3 FY2006 1.1389E+12

Q4 FY2006 1.1356E+12

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=14 Card=5 Bytes=195)

1 0 SORT (GROUP BY) (Cost=14 Card=5 Bytes=195)

2 1 HASH JOIN (Cost=7 Card=1157 Bytes=45123)

3 2 VIEW (Cost=4 Card=46 Bytes=598)

4 3 SORT (UNIQUE) (Cost=4 Card=46 Bytes=598)

5 4 INDEX (FAST FULL SCAN) OF 'SYS_IOT_TOP_7828' (UNIQUE)

6 2 TABLE ACCESS (FULL) OF 'MV_SALES' (Cost=2 Card=327

Statistics

----------------------------------------------------------

193 recursive calls

0 db block gets

49 consistent gets

2 physical reads

可以看到创建Dimension后,Oracle已经能够智能地理解交易日期中月度和季度的转换关系,查询使用到物化视图,逻辑IO由原来的428048个减少到49个,性能有了大幅的提升。

同样我们再来统计一下年度的销量信息:

Roby@XUE> select time_hierarchy.yyyy, sum(sales_amount)

2 from sales, time_hierarchy

3 where sales.trans_date = time_hierarchy.day

4 group by time_hierarchy.yyyy

5 /

YYYY SUM(SALES_AMOUNT)

---------- -----------------

2006 4.5721E+12

2007 1.2297E+10

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=10 Card=2 Bytes=66)

1 0 SORT (GROUP BY) (Cost=10 Card=2 Bytes=66)

2 1 HASH JOIN (Cost=7 Card=478 Bytes=15774)

--End--

分享到:
评论

相关推荐

    Oracle 9i10g 数据库管理详细

    - **Oracle 10g** 在9i的基础上进一步增强了可用性和性能,特别是通过Grid Computing技术实现了更高级别的资源管理和优化。 #### 二、Oracle 9i/10g 日常管理基础 - **日常管理内容** 包括但不限于:数据库启动和...

    oracle 笔试面试题目

    - **维度表(Dimension Table)**:提供对事实表的描述性信息。 10. **位图索引**:在事实表上常用于处理高基数的分类列,节省空间但不适合频繁更新。 11. **相关约束**: - **主键**:唯一标识表中每一行的非空...

    Oracle数据库DBA面试题50道及答案.pdf

    - **Dimension table(维度表)**:存储对事实表某些属性的描述信息。 9. **Fact table上需要建立的索引**: - 位图索引(bitmap index)。 10. **相关约束**: - **主键**:确保列值唯一且非空。 - **外键**...

    Oracle面试题集锦

    9. **星型架构中的表**:事实表(Fact Table)包含业务的核心数据,维度表(Dimension Table)存储对事实表的描述性信息。 10. **事实表上的索引**:位图索引适合于高基数低选择性的列,能有效减少I/O,提高聚合...

    ORACLE面试500题

    10. **Fact Table上的索引**:通常使用位图索引,适用于低基数(非唯一值)的列。 11. **相关约束**: - **主键**:确保表中记录的唯一性。 - **外键**:建立表间关联,确保数据完整性。 12. **重建母表**:临时...

    关于ORACLE面试题

    星型模型是一种常见的数据仓库设计模式,它由事实表(Fact Table)和维度表(Dimension Table)组成。事实表包含了业务活动的核心度量值,而维度表则包含了描述这些活动的详细信息。 - **事实表**:存储业务交易...

    oracle面试问题技术篇

    9. **STAR SCHEMA**:包括Fact Tables(包含业务事实数据)和Dimension Tables(包含描述性数据,如时间、地点等维度信息)。 10. **Fact Table索引**:在Fact Table上创建位图索引可以优化多对多关系的查询效率。 ...

    oracle面试题集锦.pdf

    Fact tables 包含大量的主要信息,dimension tables 存放对 fact table 某些属性描述的信息。 10. 在 FACT Table 上建立何种索引: 可以在 FACT Table 上建立位图索引 (bitmap index)。 11. 两种相关约束: 主键和...

    Oracle_DBA面试题

    9. **STAR SCHEMA中的表类型**:事实表(Fact table)包含业务度量数据,维度表(Dimension table)存储描述性信息,支持事实表。 10. **FACT Table的索引**:在事实表上通常建立位图索引,减少存储空间占用,适用...

    oracle面试题目

    在数据库设计中,尤其是星型模式(Star Schema)中,存在两种类型的表:事实表(Fact Tables)和维度表(Dimension Tables)。事实表通常包含大量的测量值或度量标准,而维度表则包含了描述事实表中记录的维度属性...

    Oracle面试题常见的问题

    Oracle面试题常见的问题 Oracle面试题是一个非常重要的知识点,涵盖了Oracle数据库管理系统的各个方面。下面我们将逐一解释每个问题和答案: 1. 解释冷备份和热备份的不同点以及各自的优点 冷备份和热备份是两种...

    oracle 11g数据库高级管理员学习指南

    Oracle 11g提供了数据仓库建模工具和OLAP(在线分析处理)功能,如星型和雪花型模型,以及Cube和Dimension的概念,为数据分析提供强大支持。 总之,Oracle 11g数据库高级管理员不仅需要熟悉数据库的基本操作,还要...

    ORACLE 面试问题-技术篇

    - **Dimension Table**:描述Fact Table中数据的附加信息,如日期维度、产品维度等。 **10. FACT Table上使用的索引类型** - **位图索引**:适用于低基数字段,如分类标识符。 #### 六、表约束 **11. 相关约束**...

    Oracle Hyperion Planning Training

    Hyperion Planning还定义了稠密维度(Dense Dimension),这是指在信息交叉引用中使用比率较高的维度,这类维度通常包含较高百分比的维度交叉点,其中包含数据。稠密维度对于处理和分析大量数据非常有用。Hyperion ...

    C#读取Excel并保存Oracle 11g

    本主题聚焦于如何使用C#来读取Excel数据,并将其存储到Oracle 11g数据库中。这涉及到两个主要的技术领域:处理Excel文件和与Oracle数据库的交互。 首先,让我们详细了解一下如何在C#中读取Excel数据。通常,我们...

    oracle行列转换总结

    在Oracle数据库中,行列转换是一项常用且强大的功能,它允许数据在不同的维度上进行转换,以便于数据分析和报告。本文将深入探讨Oracle中实现行列转换的几种方法,包括使用`UNION ALL`、`MODEL`子句以及集合类型(`...

    Oracle数据库DBA面试题50道及答案

    在Oracle数据库领域,DBA(数据库管理员)的职责包括设计、实施、维护和优化数据库系统。以下是Oracle数据库DBA面试中可能遇到的知识点: 1. 数据库备份类型及优缺点 热备份是在数据库处于归档模式下,并且数据库在...

    oracle高级面试50问

    - **Dimension Tables**:存储描述事实表中的数据的维度信息,如时间、地点等。 #### 10. Fact Table上需要建立的索引 - **Bitmap Index**:对于Fact Table而言,通常推荐使用位图索引(Bitmap Index),因为位图...

Global site tag (gtag.js) - Google Analytics