Oracle Exadata 技术浅析

sina_jerry_chen

浏览: 79770 次

最近访客更多访客>>

leo5592368

whnuliba

小菜鸡也想飞

Youkes

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

oracle

zhuan:http://dbanotes.net/database/oracle_exadata.html

自从 Oracle 和 HP 推出 Exadata 之后，我就很关注这个产品，之前也写了一篇Oracle Database Machine介绍它。去年，Oracle和SUN合并后，推出了Oracle Exadata V2，相比较上一代产品有几个变化：第一，使用 SUN 的硬件；第二，宣称支持 OLTP 应用；第三，Oracle 11g R2 提供了更多的新特性。

Exadata Smart Flash Cache

Exadata V2整体架构并没有太多改变，换用了 SUN 的硬件，除了采用 Intel 最新的 Nehalem CPU 以外，每台 Storage Cell 更是配置了 384GB 的 Flash，这也是为什么 V2 可以支持 OLTP 应用的关键。

Flash Cache 完全是自动管理，Oracle 会根据数据的访问情况，决定哪些数据放在 Flash Cache 中。所有的数据都是先被写到普通磁盘上，再根据访问情况读入 Flash Cache 的，所以如果 Flash Card 发生故障，数据不会丢失。当然，Oracle提供了方式，可以让用户手动将表或者索引 Pin 在 Flash Cache 中。

在自动管理的方式之外，Oracle还允许用户人工创建flash disks，和普通磁盘一样，这些 Flash Disks 通过 ASM 输出给数据库使用，用户可以把一些访问非常频繁的数据文件放在上面。这些 Flash Disks 不仅仅是 Cache 了，所以 ASM 会在Cell 和 Cell 之间做镜像。如果某块卡发生故障，那么整个 Storage Cell 上的 Flash Disks 会 offline，保证数据不会丢失。

Smart Scan

Smart Scan是 Exadata 最重要的一个功能，它的作用就是把 SQL 放在每个 Cell 上去运行，然后每个 Cell 只返回符合条件的数据给数据库，这样就极大的降低了数据库服务器的负载和网络流量，并充分利用了 Cell 的计算资源和 IO 资源。

传统方式：所有的数据都需要返回给数据库服务器，网络带宽要求高，所有的计算在数据库服务器上完成。

Smart scan：只返回符合条件的数据，减少网络带宽，并充分利用了 Cell 上的计算和 IO 资源。

这里有一点要注意，在使用 Smart Scan 时，每个 Cell 返回给 DB Server 的是结果集，而不再是传统的 Block， DB Server 完成结果集的处理，并返回给客户端。

Smart Scan 如何处理 Join ？

这是我一直想要搞清楚的问题。事实上， Smart Scan 只能处理 Join filtering，而真正 Join 的工作必须在 DB Server上完成，而且Smart Scan 仅适合于处理 DSS 环境的复杂 Join，对于 OLTP 类型的简单 Join，Smart Scan 并不能发挥其优势。设想下面的查询：

select e.ename,d.dname from emp e, dept d where and e.ename='Jacky' and e.deptno=d.deptno;

假设采用 nested loops join，Smart Scan 只能完成 e.ename=’Jacky’ 这个条件的过滤，然后将符合条件的 emp 表的数据返回到 DB server，然后由 DB Server 完成 join 的工作，逐条查询dept表 (e.deptno=d.deptno) 的数据。所以 Smart Scan 并不适合nested loop join（我认为 Smart Scan 只有在适合的条件下才会启用），只有 DSS 环境的大数据量复杂join才会发挥出优势。而且 Smart Scan 只能完成filtering的工作，而不能真正完成 Join 的工作，这个与 Greenplum 数据库是不同的（有兴趣可以看我的文章，Greenplum技术浅析）。设想下面的查询（emp和dept都是大表）：

select e.ename,d.dname from emp e, dept d where e.deptno=d.deptno;

假设采用 Hash Join ，由于没有任何过滤条件， Smart Scan 只能把两个表的数据全部返回到 DB Server 上进行join操作，不过 Smart Scan 也不是一点用都没有，至少还可以进行 column 的过滤，只返回需要的字段就可以了。

Oracle 的文档中，曾经提到对于一个大表和小表join时， Smart Scan 会采用bloom filter来快速定位（可以看我以前的文章，有趣的 bloom filter ）。方法是把小表build成为bloom filter，然后在每个storage cell上对大表做scan，利用bloom filter快速定位符合条件的结果，并返回给 DB Server 作 join。

Storage Index

存储索引，顾名思义是在存储级别建立的索引，简单的说就是为表中的每一列数据建立一个索引，每个index entry记录一段数据区间的最大值，最小值以及它们的物理位置，文档上说1MB数据对应一条index entry，见下图：

如果我们查询B<2，或者B>8的数据，根据存储索引，我们就可以跳过这些不在min和max之间的数据块，极大的提高了扫描的速度，这就是存储索引的意义。

Hybrid Columnar Compress

首先我们要搞清楚，什么是行压缩，什么叫列压缩。我们熟悉的数据库，如Oracle、MySQL等都是基于行的数据库，就是行的不同字段物理上存放在一起，还有一种是基于列的数据库，就是每个字段的不同行物理上存放在一起。他们的优缺点同样突出：

基于行的数据库，访问一行非常方便，但是由于同一列的数据是分开存放的，如果要针对某一列进行查询时，几乎要扫描整个表才能得到结果。基于行数据库的压缩，称为行压缩。

基于列的数据库，因为同一列的数据物理上放在一起，所以访问一列非常方便，也就是说如果针对某一列进行查询时，不需要扫描整个表，只需要扫描这一列的数据就可以了，但是访问一行的全部字段非常不方便（又是废话）。基于列数据库的压缩，称为列压缩。

Oracle 通常说的 compress 功能（包括11g R2的Advanced compress），都是行压缩，因为Oracle是个基于行的数据库。大概的方法就是在block头部存放一个symbol table，然后将相同的值放在那里，每行上相同的数据指向symbol table，以此来达到压缩的目的。行压缩的效果通常不好，因为我们知道行与行之间，其实相同的数据并不多。但是列压缩则不同，因为相同列的数据类型相同，很容易达到很好的压缩效果。

行压缩和列压缩都有其优缺点，而Oracle的混合列压缩技术，实际上是融合了列压缩的高压缩比和行数据库的访问特性，将两者的优点结合起来。 Oracle提出了 CU 的概念（compress unit），在一个 CU 内，是一个基于列的存储方式，采用列压缩，但是一个 CU 内保存了行的所有字段信息，所以在CU与CU之间，Oracle还是一个基于行的数据库，访问某一行，总是只在一个 CU 内。每个CU由一些连续的block组成，CU header中记录了每一行的各个列在CU中的分布情况，在混合列压缩模式下，一行通常是跨多个block的。

所以说混合列压缩，结合了列压缩和行访问的特点，即可以提供非常高的压缩率，又很好的保证了基于行类型的访问。

Exadata的另一个重要功能是 IO resource management，如果我们在一个 Exadata 上部署了很多个数据库，可以用它来管理 IO 资源，这里就不作阐述了。

目前，我还没有了解到在国内有 Exadata 的应用，而且资料也是比较少的。希望有机会可以真实的测试一下它的性能，我不怀疑他在 DSS 环境下的表现，但是对于 OLTP 类型的应用，是否真的象 Oracle 说的那么强劲，还有待于验证。

分享到：

Solr\Lucene优劣势分析 | http响应Last-Modified和ETag以及Apache ...

2013-03-06 10:48
浏览 757
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

oracle exadata技术浅析: oracle exadata技术浅析自从 Oracle 和 HP 推出 Exadata 之后，我就很关注这个产品，之前也写了一篇Oracle Database Machine介绍它。去年，Oracle和SUN合并后，推出了Oracle Exadata V2，相比较上一代产品有几个...

《数据结构》（02331）基础概念: 内容概要：本文档《数据结构》（02331）第一章主要介绍数据结构的基础概念，涵盖数据与数据元素的定义及其特性，详细阐述了数据结构的三大要素：逻辑结构、存储结构和数据运算。逻辑结构分为线性结构（如线性表、栈、队列）、树形结构（涉及根节点、父节点、子节点等术语）和其他结构。存储结构对比了顺序存储和链式存储的特点，包括访问方式、插入删除操作的时间复杂度以及空间分配方式，并介绍了索引存储和散列存储的概念。最后讲解了抽象数据类型（ADT）的定义及其组成部分，并探讨了算法分析中的时间复杂度计算方法。适合人群：计算机相关专业学生或初学者，对数据结构有一定兴趣并希望系统学习其基础知识的人群。使用场景及目标：①理解数据结构的基本概念，掌握逻辑结构和存储结构的区别与联系；②熟悉不同存储方式的特点及应用场景；③学会分析简单算法的时间复杂度，为后续深入学习打下坚实基础。阅读建议：本章节内容较为理论化，建议结合实际案例进行理解，尤其是对于逻辑结构和存储结构的理解要深入到具体的应用场景中，同时可以尝试编写一些简单的程序来加深对抽象数据类型的认识。

【工业自动化】施耐德M580 PLC系统架构详解：存储结构、硬件配置与冗余设计: 内容概要：本文详细介绍了施耐德M580系列PLC的存储结构、系统硬件架构、上电写入程序及CPU冗余特性。在存储结构方面，涵盖拓扑寻址、Device DDT远程寻址以及寄存器寻址三种方式，详细解释了不同类型的寻址方法及其应用场景。系统硬件架构部分，阐述了最小系统的构建要素，包括CPU、机架和模块的选择与配置，并介绍了常见的系统拓扑结构，如简单的机架间拓扑和远程子站以太网菊花链等。上电写入程序环节，说明了通过USB和以太网两种接口进行程序下载的具体步骤，特别是针对初次下载时IP地址的设置方法。最后，CPU冗余部分重点描述了热备功能的实现机制，包括IP通讯地址配置和热备拓扑结构。适合人群：从事工业自动化领域工作的技术人员，特别是对PLC编程及系统集成有一定了解的工程师。使用场景及目标：①帮助工程师理解施耐德M580系列PLC的寻址机制，以便更好地进行模块配置和编程；②指导工程师完成最小系统的搭建，优化系统拓扑结构的设计；③提供详细的上电写入程序指南，确保程序下载顺利进行；④解释CPU冗余的实现方式，提高系统的稳定性和可靠性。其他说明：文中还涉及一些特殊模块的功能介绍，如定时器事件和Modbus串口通讯模块，这些内容有助于用户深入了解M580系列PLC的高级应用。此外，附录部分提供了远程子站和热备冗余系统的实物图片，便于用户直观理解相关概念。

某型自动垂直提升仓储系统方案论证及关键零部件的设计.zip: 某型自动垂直提升仓储系统方案论证及关键零部件的设计.zip

2135D3F1EFA99CB590678658F575DB23.pdf#page=1&view=fitH: 2135D3F1EFA99CB590678658F575DB23.pdf#page=1&view=fitH

agentransack文本搜索软件: 可以搜索文本内的内容，指定目录，指定文件格式，匹配大小写等

Windows 平台 Android Studio 下载与安装指南.zip: Windows 平台 Android Studio 下载与安装指南.zip

Android Studio Meerkat 2024.3.1 Patch 1（android-studio-2024.3.1.14-windows-zip.zip.002): Android Studio Meerkat 2024.3.1 Patch 1（android-studio-2024.3.1.14-windows.zip）适用于Windows系统，文件使用360压缩软件分割成两个压缩包，必须一起下载使用： part1: https://download.csdn.net/download/weixin_43800734/90557033 part2: https://download.csdn.net/download/weixin_43800734/90557035

4-3-台区智能融合终端功能模块技术规范（试行）.pdf: 国网台区终端最新规范

4-13-台区智能融合终端软件检测规范（试行）.pdf: 国网台区终端最新规范

【锂电池剩余寿命预测】Transformer-GRU锂电池剩余寿命预测（Matlab完整源码和数据）: 1.【锂电池剩余寿命预测】Transformer-GRU锂电池剩余寿命预测（Matlab完整源码和数据） 2.数据集：NASA数据集，已经处理好，B0005电池训练、B0006测试； 3.环境准备：Matlab2023b，可读性强； 4.模型描述：Transformer-GRU在各种各样的问题上表现非常出色，现在被广泛使用。 5.领域描述：近年来，随着锂离子电池的能量密度、功率密度逐渐提升，其安全性能与剩余使用寿命预测变得愈发重要。本代码实现了Transformer-GRU在该领域的应用。 6.作者介绍：机器学习之心，博客专家认证，机器学习领域创作者，2023博客之星TOP50，主做机器学习和深度学习时序、回归、分类、聚类和降维等程序设计和案例分析，文章底部有博主联系方式。从事Matlab、Python算法仿真工作8年，更多仿真源码、数据集定制私信。

基于android的家庭收纳App的设计与实现.zip: Android项目原生java语言课程设计，包含LW+ppt

大学生入门前端-五子棋vue项目: 大学生入门前端-五子棋vue项目

二手车分析完整项目，包含源代码和数据集，包含：XGBoost 模型，训练模型代码，数据集包含 10,000 条二手车记录的数据集，涵盖车辆品牌、型号、年份、里程数、发动机缸数、价格等: 这是一个完整的端到端解决方案，用于分析和预测阿联酋（UAE）地区的二手车价格。数据集包含 10,000 条二手车信息，覆盖了迪拜、阿布扎比和沙迦等城市，并提供了精确的地理位置数据。此外，项目还包括一个基于 Dash 构建的 Web 应用程序代码和一个训练好的 XGBoost 模型，帮助用户探索区域市场趋势、预测车价以及可视化地理空间洞察。数据集内容项目文件以压缩 ZIP 归档形式提供，包含以下内容：数据文件： data/uae_used_cars_10k.csv：包含 10,000 条二手车记录的数据集，涵盖车辆品牌、型号、年份、里程数、发动机缸数、价格、变速箱类型、燃料类型、颜色、描述以及销售地点（如迪拜、阿布扎比、沙迦）。模型文件： models/stacking_model.pkl：训练好的 XGBoost 模型，用于预测二手车价格。 models/scaler.pkl：用于数据预处理的缩放器。 models.py：模型相关功能的实现。 train_model.py：训练模型的脚本。 Web 应用程序文件： app.py：Dash 应用程序的主文件。 callback

《基于YOLOv8的船舶航行违规并线预警系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

《基于YOLOv8的工业布匹瑕疵分类系统》（包含源码、可视化界面、完整数据集、部署教程）简单部署即可运行。功能完善、操作简单，适合毕设或课程设计.zip: 资源内项目源码是来自个人的毕业设计，代码都测试ok，包含源码、数据集、可视化页面和部署说明，可产生核心指标曲线图、混淆矩阵、F1分数曲线、精确率-召回率曲线、验证集预测结果、标签分布图。都是运行成功后才上传资源，毕设答辩评审绝对信服的保底85分以上，放心下载使用，拿来就能用。包含源码、数据集、可视化页面和部署说明一站式服务，拿来就能用的绝对好资源！！！项目备注 1、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习，也适合小白学习进阶，当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能，也可用于毕设、课设、作业等。下载后请首先打开README.txt文件，仅供学习参考, 切勿用于商业用途。

CodeCount.exe: 此为代码审查工具可查文件数，字节数，总行数，代码行数，注释行数，空白行数，注释率等

商业数据分析与Python实现：企业破产概率及抽样技术解析（复现论文或解答问题，含详细可运行代码及解释）: 内容概要：本文档涵盖了一项关于企业破产概率的详细分析任务，分为书面回答和Python代码实现两大部分。第一部分涉及对业务类型和破产状态的边际分布、条件分布及相对风险的计算，并绘制了相应的二维条形图。第二部分利用Python进行了数据处理和可视化，包括计算比值比、识别抽样技术类型、分析鱼类数据集以及探讨辛普森悖论。此外，还提供了针对鱼类和树木数据的统计分析方法。适合人群：适用于有一定数学和编程基础的学习者，尤其是对统计学、数据分析感兴趣的大学生或研究人员。使用场景及目标：①帮助学生掌握统计学概念如边际分布、条件分布、相对风险和比值比的实际应用；②教授如何用Python进行数据清洗、分析和可视化；③提高对不同类型抽样技术和潜在偏见的理解。其他说明：文档不仅包含了理论知识讲解，还有具体的代码实例供读者参考实践。同时提醒读者在完成作业时需要注意提交格式的要求。

MCP快速入门实战，详细的实战教程: MCP快速入门实战，详细的实战教程

python，playwright基础: python，playwright基础

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论