`

深入理解Oracle—驱动表的那些事儿

阅读更多

        以一个比较两本字典来做例子:

       一本字典有索引目录(dict a),一本没有(dict b),现在要找出所有a开头的单词的异同,那么比较的时候,你会怎么比较?

        合理的做法应该是以没有索引的字典dict b开始, 找到a开头的那一页, 然后对于每个单词, 通过使用索引在dict a中找到相应的条目。

        如果反过来, 效率会相同吗?

        驱动表,通俗的讲就是先从哪个表开始检索,良好的驱动表是成功优化的一半。例如:

select * from a,b where a.id = b.id and a.姓名 = '美格瑞恩' and b.性别 = '女';

        在a,b表同等数量级的情况下,显然用a表做为驱动表比较好,因为姓名相对于性别来说可以过滤掉更多的数据,所以想办法使你的执行计划先扫描a表再通过nest loop与b表关连比较理想。

        一般而言,2个表的时候,选择小表;3个或者以上的时候,选择关联比较多的表作为驱动表。

        不过,事无绝对,看个案例先:

        有两个表T1和T2,可以假设T1存放姓名、ID这些基本信息,每行较短,而T2也有ID列和一些说明、备注类信息,每行长的可能有一两千个字节。

        对于这两个表,使用嵌套循环连接,T1表占的块数比较少,是小表,而T2表占的块数几倍于T1,是大表。那么,应该T1做驱动表更好一些,但实际却是T2大表做驱动表更好。

        一个不知道DBA还是开发,不知道这一点,为了强制小表T1做驱动表,写了类如下语句:

select /*+ ordered use_nl(t1,t2) */ from t2,t1 where t1.id=t2.id;

        后来这个语句造成了一些性能问题。通过了解嵌套循环的工作方式,发现这里的确是大表做驱动表好一些。

        这里就说明了一个问题,都说嵌套循环要小表做驱动表,如果不知道这是为什么,这很容易造成人云亦云。这样只知其表,而不知其里,很容易影响以后在某些问题上做出的判断。

        驱动表(driving table/outer table)又称为外层表,驱动表仅仅用于nested_loop join和hash join,驱动表是用来驱动查询的,在CBO中,优化器会根据cost自动选择驱动表,与表的顺序无关。

        通常情况下,驱动表的选择性较高(该列唯一键与列的比值较高),where中的限制条件较多,返回的行数较少的表适合做驱动表。

        事实上,大表有时候也会做驱动表,只要在大表上面限制条件较多,从大表上面返回的行数较少的话,大表也适合做驱动表。

        始终要记住的就是返回的结果集(某个表被过滤后的数据,或者某些表join产生的数据)较小的表适合做驱动表。也就是说,哪个返回数据少,哪个就做驱动表,即连接操作应从返回较少行上驱动。我们在看执行计划的时候,离nested loops,hash join 近的表就是驱动表,也就是说执行计划中靠上的表是驱动表。

        以下是几个快速判断驱动表的经验,可能有错哦:

        (1)用于连接的子句的列应被索引、在Where子句中应尽量利用索引,而不是避开索引  

        (2)连接操作应从返回较少行上驱动

        (3)如果所连接的表A和B,A表长度远远大于B表,建议从较大的A表上驱动  

        (4)如果Where子句中含有选择性条件,Where No=20,将最具有选择性部分放在表达式最后  

        (5)如果只有一个表有索引,另一表无索引,无索引的表通常作为驱动表。如A表的No列已被索引,而B表的No列没被索引,则应当B表作为驱动表,A表作为被驱动表。

RULE 下所谓驱动表

        我们以nested  loop为例:

        如果两个表连接字段都没有索引(通常这个时候是sort  merge/hash  join),则驱动表会选择后者;

        若两个表其中有一个有索引而另外一个没有索引,则驱动表是没有索引那一个,跟顺序无关;

        若两个表都有索引,则驱动表为后面那一个表。

        所以事实上,RULE下,只有在两个表都存在连接字段的索引的情况下才需要考虑顺序问题,也就是小表放在后面,大表放在前面(当然到底哪个好这实际上还跟符合条件的记录数、数据分布等因素相关,所以应该以实际测试为准,而如果是 CBO 下,则跟顺序无关。 

        关键的是明白执行计划,而不在于记住什么规则。

        例如,表连接返回一条记录,存在2张表,一个10条记录,一个1000万条记录,若2表都存在连接字段索引。

        以小表为驱动表,则代价为:10*(通过索引在大表查询一条记录的代价);

        以大表为驱动表,则代价为:1000万*(通过索引在小表查询一条记录的代价)。

        通过索引获取一条记录,10rows的表,代价通常在3 blocks,索引2块,表1块。而如果是1000万的表,索引可能达到4块,表1块,速度掰着脚趾头都知道了哈。

 

文章来源:http://www.2cto.com/database/201301/186606.html

分享到:
评论

相关推荐

    编程的那些事(包括很多内容)

    在编程的世界里,有无数的知识点等待我们去探索和学习。"编程的那些事儿"这个主题涵盖的内容广泛,包括但不限于编程语言、算法与数据结构、软件工程、...通过深入理解和掌握上述知识点,你将在编程的世界里游刃有余。

    win7修复本地系统工具

    win7修复本地系统工具

    《自动化专业英语》04-Automatic-Detection-Block(自动检测模块).ppt

    《自动化专业英语》04-Automatic-Detection-Block(自动检测模块).ppt

    《计算机专业英语》chapter12-Intelligent-Transportation.ppt

    《计算机专业英语》chapter12-Intelligent-Transportation.ppt

    西门子S7-1200博图平台下3轴伺服螺丝机程序解析与应用

    内容概要:本文详细介绍了基于西门子S7-1200博图平台的3轴伺服螺丝机程序。该程序使用SCL语言编写,结合KTP700组态和TIA V14及以上版本,实现了对X、Y、Z三个轴的精密控制。文章首先概述了程序的整体架构,强调了其在自动化控制领域的高参考价值。接着深入探讨了关键代码片段,如轴初始化、运动控制以及主程序的设计思路。此外,还展示了如何通过KTP700组态实现人机交互,并分享了一些实用的操作技巧和技术细节,如状态机设计、HMI交互、异常处理等。 适用人群:从事自动化控制系统开发的技术人员,尤其是对西门子PLC编程感兴趣的工程师。 使用场景及目标:适用于希望深入了解西门子S7-1200博图平台及其SCL语言编程特点的学习者;旨在帮助读者掌握3轴伺服系统的具体实现方法,提高实际项目中的编程能力。 其他说明:文中提供的代码示例和设计理念不仅有助于理解和学习,还能直接应用于类似的实际工程项目中。

    MATLAB仿真:非线性滤波器在水下长基线定位(LBL)系统的应用与比较

    内容概要:本文详细探讨了五种非线性滤波器(卡尔曼滤波(KF)、扩展卡尔曼滤波(EKF)、无迹卡尔曼滤波(UKF)、粒子滤波(PF)和变维卡尔曼滤波(VDKF))在水下长基线定位(LBL)系统中的应用。通过对每种滤波器的具体实现进行MATLAB代码展示,分析了它们在不同条件下的优缺点。例如,KF适用于线性系统但在非线性环境中失效;EKF通过雅可比矩阵线性化处理非线性问题,但在剧烈机动时表现不佳;UKF利用sigma点处理非线性,精度较高但计算量大;PF采用蒙特卡罗方法,鲁棒性强但计算耗时;VDKF能够动态调整状态维度,适合信标数量变化的场景。 适合人群:从事水下机器人(AUV)导航研究的技术人员、研究生以及对非线性滤波感兴趣的科研工作者。 使用场景及目标:①理解各种非线性滤波器的工作原理及其在水下定位中的具体应用;②评估不同滤波器在特定条件下的性能,以便为实际项目选择合适的滤波器;③掌握MATLAB实现非线性滤波器的方法和技术。 其他说明:文中提供了详细的MATLAB代码片段,帮助读者更好地理解和实现这些滤波器。此外,还讨论了数值稳定性问题和一些实用技巧,如Cholesky分解失败的处理方法。

    VMware-workstation-full-14.1.3-9474260

    VMware-workstation-full-14.1.3-9474260

    DeepSeek系列-提示词工程和落地场景.pdf

    DeepSeek系列-提示词工程和落地场景.pdf

    javaSE阶段面试题

    javaSE阶段面试题

    《综合布线施工技术》第5章-综合布线工程测试.ppt

    《综合布线施工技术》第5章-综合布线工程测试.ppt

    安川机器人NX100使用说明书.pdf

    安川机器人NX100使用说明书.pdf

    S7-1200 PLC改造M7120平面磨床电气控制系统:IO分配、梯形图设计及组态画面实现

    内容概要:本文详细介绍了将M7120型平面磨床的传统继电器控制系统升级为基于西门子S7-1200 PLC的自动化控制系统的过程。主要内容涵盖IO分配、梯形图设计和组态画面实现。通过合理的IO分配,确保了系统的可靠性和可维护性;梯形图设计实现了主控制逻辑、砂轮升降控制和报警逻辑等功能;组态画面则提供了友好的人机交互界面,便于操作和监控。此次改造显著提高了设备的自动化水平、运行效率和可靠性,降低了维护成本。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是熟悉PLC编程和控制系统设计的专业人士。 使用场景及目标:适用于需要进行老旧设备升级改造的企业,旨在提高生产设备的自动化水平和可靠性,降低故障率和维护成本。具体应用场景包括但不限于金属加工行业中的平面磨床等设备的控制系统改造。 其他说明:文中还分享了一些实际调试中的经验和技巧,如急停逻辑的设计、信号抖动的处理方法等,有助于读者在类似项目中借鉴和应用。

    chromedriver-linux64-136.0.7103.48.zip

    chromedriver-linux64-136.0.7103.48.zip

    IMG_20250421_180507.jpg

    IMG_20250421_180507.jpg

    《网络营销策划实务》项目一-网络营销策划认知.ppt

    《网络营销策划实务》项目一-网络营销策划认知.ppt

    Lianantech_Security-Vulnerabil_1744433229.zip

    Lianantech_Security-Vulnerabil_1744433229

    MybatisCodeHelperNew2019.1-2023.1-3.4.1.zip

    MybatisCodeHelperNew2019.1-2023.1-3.4.1

    《Approaching(Almost)any machine learning problem》中文版第13章(最后一章)

    【深度学习部署】基于Docker的BERT模型训练与API服务部署:实现代码复用与模型共享

    火车票订票系统设计与实现(代码+数据库+LW)

    摘  要 传统办法管理信息首先需要花费的时间比较多,其次数据出错率比较高,而且对错误的数据进行更改也比较困难,最后,检索数据费事费力。因此,在计算机上安装火车票订票系统软件来发挥其高效地信息处理的作用,可以规范信息管理流程,让管理工作可以系统化和程序化,同时,火车票订票系统的有效运用可以帮助管理人员准确快速地处理信息。 火车票订票系统在对开发工具的选择上也很慎重,为了便于开发实现,选择的开发工具为Eclipse,选择的数据库工具为Mysql。以此搭建开发环境实现火车票订票系统的功能。其中管理员管理用户,新闻公告。 火车票订票系统是一款运用软件开发技术设计实现的应用系统,在信息处理上可以达到快速的目的,不管是针对数据添加,数据维护和统计,以及数据查询等处理要求,火车票订票系统都可以轻松应对。 关键词:火车票订票系统;SpringBoot框架,系统分析,数据库设计

    【ABB机器人】-00标准保养简介.pdf

    【ABB机器人】-00标准保养简介.pdf

Global site tag (gtag.js) - Google Analytics