zhuan:http://dbanotes.net/database/oracle_exadata.html
自从 Oracle 和 HP 推出 Exadata 之后,我就很关注这个产品,之前也写了一篇Oracle Database Machine介绍它。去年,Oracle和SUN合并后,推出了Oracle Exadata V2,相比较上一代产品有几个变化:第一,使用 SUN 的硬件;第二,宣称支持 OLTP 应用;第三,Oracle 11g R2 提供了更多的新特性。
Exadata Smart Flash Cache
Exadata V2整体架构并没有太多改变,换用了 SUN 的硬件,除了采用 Intel 最新的 Nehalem CPU 以外,每台 Storage Cell 更是配置了 384GB 的 Flash,这也是为什么 V2 可以支持 OLTP 应用的关键。
Flash Cache 完全是自动管理,Oracle 会根据数据的访问情况,决定哪些数据放在 Flash Cache 中。所有的数据都是先被写到普通磁盘上,再根据访问情况读入 Flash Cache 的,所以如果 Flash Card 发生故障,数据不会丢失。当然,Oracle提供了方式,可以让用户手动将表或者索引 Pin 在 Flash Cache 中。
在自动管理的方式之外,Oracle还允许用户人工创建flash disks,和普通磁盘一样,这些 Flash Disks 通过 ASM 输出给数据库使用,用户可以把一些访问非常频繁的数据文件放在上面。这些 Flash Disks 不仅仅是 Cache 了,所以 ASM 会在Cell 和 Cell 之间做镜像。如果某块卡发生故障,那么整个 Storage Cell 上的 Flash Disks 会 offline,保证数据不会丢失。
Smart Scan
Smart Scan是 Exadata 最重要的一个功能,它的作用就是把 SQL 放在每个 Cell 上去运行,然后每个 Cell 只返回符合条件的数据给数据库,这样就极大的降低了数据库服务器的负载和网络流量,并充分利用了 Cell 的计算资源和 IO 资源。
传统方式:所有的数据都需要返回给数据库服务器,网络带宽要求高,所有的计算在数据库服务器上完成。
Smart scan:只返回符合条件的数据,减少网络带宽,并充分利用了 Cell 上的计算和 IO 资源。
这里有一点要注意,在使用 Smart Scan 时,每个 Cell 返回给 DB Server 的是结果集,而不再是传统的 Block, DB Server 完成结果集的处理,并返回给客户端。
Smart Scan 如何处理 Join ?
这是我一直想要搞清楚的问题。事实上, Smart Scan 只能处理 Join filtering,而真正 Join 的工作必须在 DB Server上完成,而且Smart Scan 仅适合于处理 DSS 环境的复杂 Join,对于 OLTP 类型的简单 Join,Smart Scan 并不能发挥其优势。设想下面的查询:
select e.ename,d.dname from emp e, dept d where and e.ename='Jacky' and e.deptno=d.deptno;
假设采用 nested loops join,Smart Scan 只能完成 e.ename=’Jacky’ 这个条件的过滤,然后将符合条件的 emp 表的数据返回到 DB server,然后由 DB Server 完成 join 的工作,逐条查询dept表 (e.deptno=d.deptno) 的数据。所以 Smart Scan 并不适合nested loop join(我认为 Smart Scan 只有在适合的条件下才会启用),只有 DSS 环境的大数据量复杂join才会发挥出优势。而且 Smart Scan 只能完成filtering的工作,而不能真正完成 Join 的工作,这个与 Greenplum 数据库是不同的(有兴趣可以看我的文章,Greenplum技术浅析)。设想下面的查询(emp和dept都是大表):
select e.ename,d.dname from emp e, dept d where e.deptno=d.deptno;
假设采用 Hash Join ,由于没有任何过滤条件, Smart Scan 只能把两个表的数据全部返回到 DB Server 上进行join操作,不过 Smart Scan 也不是一点用都没有,至少还可以进行 column 的过滤,只返回需要的字段就可以了。
Oracle 的文档中,曾经提到对于一个大表和小表join时, Smart Scan 会采用bloom filter来快速定位(可以看我以前的文章,有趣的 bloom filter )。方法是把小表build成为bloom filter,然后在每个storage cell上对大表做scan,利用bloom filter快速定位符合条件的结果,并返回给 DB Server 作 join。
Storage Index
存储索引,顾名思义是在存储级别建立的索引,简单的说就是为表中的每一列数据建立一个索引,每个index entry记录一段数据区间的最大值,最小值以及它们的物理位置,文档上说1MB数据对应一条index entry,见下图:
如果我们查询B<2,或者B>8的数据,根据存储索引,我们就可以跳过这些不在min和max之间的数据块,极大的提高了扫描的速度,这就是存储索引的意义。
Hybrid Columnar Compress
首先我们要搞清楚,什么是行压缩,什么叫列压缩。我们熟悉的数据库,如Oracle、MySQL等都是基于行的数据库,就是行的不同字段物理上存放在一起,还有一种是基于列的数据库,就是每个字段的不同行物理上存放在一起。他们的优缺点同样突出:
基于行的数据库,访问一行非常方便,但是由于同一列的数据是分开存放的,如果要针对某一列进行查询时,几乎要扫描整个表才能得到结果。基于行数据库的压缩,称为行压缩。
基于列的数据库,因为同一列的数据物理上放在一起,所以访问一列非常方便,也就是说如果针对某一列进行查询时,不需要扫描整个表,只需要扫描这一列的数据就可以了,但是访问一行的全部字段非常不方便(又是废话)。基于列数据库的压缩,称为列压缩。
Oracle 通常说的 compress 功能(包括11g R2的Advanced compress),都是行压缩,因为Oracle是个基于行的数据库。大概的方法就是在block头部存放一个symbol table,然后将相同的值放在那里,每行上相同的数据指向symbol table,以此来达到压缩的目的。行压缩的效果通常不好,因为我们知道行与行之间,其实相同的数据并不多。但是列压缩则不同,因为相同列的数据类型相 同,很容易达到很好的压缩效果。
行压缩和列压缩都有其优缺点,而Oracle的混合列压缩技术,实际上是融合了列压缩的高压缩比和行数据库的访问特性,将两者的优点结合起来。 Oracle提出了 CU 的概念(compress unit),在一个 CU 内,是一个基于列的存储方式,采用列压缩,但是一个 CU 内保存了行的所有字段信息,所以在CU与CU之间,Oracle还是一个基于行的数据库,访问某一行,总是只在一个 CU 内。每个CU由一些连续的block组成,CU header中记录了每一行的各个列在CU中的分布情况,在混合列压缩模式下,一行通常是跨多个block的。
所以说混合列压缩,结合了列压缩和行访问的特点,即可以提供非常高的压缩率,又很好的保证了基于行类型的访问。
Exadata的另一个重要功能是 IO resource management,如果我们在一个 Exadata 上部署了很多个数据库,可以用它来管理 IO 资源,这里就不作阐述了。
目前,我还没有了解到在国内有 Exadata 的应用,而且资料也是比较少的。希望有机会可以真实的测试一下它的性能,我不怀疑他在 DSS 环境下的表现,但是对于 OLTP 类型的应用,是否真的象 Oracle 说的那么强劲,还有待于验证。
相关推荐
oracle exadata技术浅析 自从 Oracle 和 HP 推出 Exadata 之后,我就很关注这个产品,之前也写了一篇Oracle Database Machine介绍它。去年,Oracle和SUN合并后,推出了Oracle Exadata V2,相比较上一代产品有几个...
Oracle Exadata一体机作为高性能的数据处理平台,集成了数据库、存储与网络技术于一体,为大数据量的处理提供了高效、稳定、安全的解决方案。本文章将从Oracle Exadata一体机的架构、特点、优势以及应用场景等方面...
Oracle提供了详尽的技术文档和用户指南,如《Oracle Exadata Database Machine Owner's Guide》(11g Release 2),帮助用户深入了解产品特性和使用方法。此外,Oracle还提供了专业培训和技术支持服务,确保用户能够...
深入理解Oracle Exadata
Oracle Exadata是Oracle公司推出的一款高性能数据库机器,它集成了硬件与软件优化技术,旨在为用户提供高效的数据处理能力。接下来,我们将围绕Oracle Exadata的核心技术和应用场景进行深入探讨。 ### Oracle ...
### 基于Oracle Exadata的数据库整合及性能优化 #### 概述 本文档探讨了如何利用Oracle Exadata这一先进的数据库平台来进行数据库整合及性能优化。Oracle Exadata结合了智能存储软件与标准化硬件,旨在提供高效能...
### Oracle Exadata关键技术知识点 #### 一、Oracle Exadata简介 **Oracle Exadata**是Oracle公司推出的一款高度集成的数据仓库和数据库系统平台,它结合了高性能的硬件与优化过的Oracle数据库软件,旨在提供卓越...
根据提供的文件信息,我们可以推断出这是一份关于Oracle Exadata的官方培训材料。下面将对这份材料中涉及的关键知识点进行详细的阐述。 ### Oracle Exadata概述 Oracle Exadata是一款高度集成的数据仓库和数据库云...
Oracle Exadata Database Machine 通过其独特的架构设计和先进的技术,在数据处理速度和效率方面取得了突破性的进展,成为了现代企业数据管理和分析的强大工具。无论是对于需要高效处理大量数据的数据仓库还是要求极...
《Oracle Exadata优化性能的关键策略》 Oracle Exadata作为一款高度优化的数据仓库和数据库平台,其设计初衷就是为了提供卓越的数据库性能。Exadata通过结合硬件和软件的深度集成,为Oracle数据库提供了无与伦比的...
- **定义与特点**:“深入理解Oracle Exadata”一书详细介绍了Oracle Exadata的定义及其独特的技术优势,如智能扫描(Smart Scan)、混合列式压缩(Hybrid Columnar Compression, HCC)、存储索引(Storage Indexes)等。...
Oracle Exadata Recipes takes an example-based, problem/solution approach in showing how to size, install, configure, manage, monitor, optimize, and migrate Oracle database workloads on and to the ...
Oracle Exadata X3系统是Oracle Exadata的一个重要版本,它在新一代技术的加持下,性能得到了大幅提升。 首先,我们来了解一下Oracle Exadata X3的主要特点。首先,它的响应速度提高了40%,这使得数据处理更加迅速...
Oracle Exadata X2数据库一体机是一款专为高性能、高可用性和大数据量处理设计的企业级数据库解决方案。这款设备集成了Oracle数据库软件、硬件和存储技术,旨在优化数据库工作负载,提供前所未有的性能和可扩展性。 ...
**Oracle Exadata** 是一种专为运行 Oracle 数据库而设计的高性能硬件和软件一体化解决方案。它通过集成优化的硬件与软件,提供了卓越的数据处理能力,特别是在大规模数据仓库和在线事务处理(OLTP)场景下表现突出...
2. Oracle Exadata一体机的高效备份:Exadata是一款由Oracle公司开发的高性能的数据库服务器和存储系统,它采用了一体化的设计,将数据库服务器、存储设备、网络组件等集中在一个机柜中,旨在提供高速的数据库服务和...