（转）深入研究B树索引（五）续

mingjian01

浏览: 29845 次
性别:
来自: 广州

最近访客更多访客>>

MartinDon

InJavaWeTrust

woodding2008

qindongliang1922

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

收藏转发

SQL

5.3 重建 B 树索引对于查询性能的影响

最后我们来看一下重建索引对于性能的提高到底会有什么作用。假设我们有一个表，该表具有 1 百万条记录，占用了 100000 个数据块。而在该表上存在一个索引，在重建之前的 pct_used 为 50% ，高度为 3 ，分支节点块数为 40 个，再加一个根节点块，叶子节点数为 10000 个；重建该索引以后， pct_used 为 90% ，高度为 3 ，分支节点块数下降到 20 个，再加一个根节点块，而叶子节点数下降到 5000 个。那么从理论上说：

1）如果通过索引获取单独 1 条记录来说：

重建之前的成本： 1 个根＋ 1 个分支＋ 1 个叶子＋ 1 个表块＝ 4 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 1 个叶子＋ 1 个表块＝ 4 个逻辑读

性能提高百分比： 0

2）如果通过索引获取 100 条记录（占总记录数的 0.01% ）来说，分两种情况：

最差的 clustering_factor （即该值等于表的数据行数）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.0001*10000 （ 1 个叶子）＋ 100 个表块＝ 103 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.0001*5000 （ 1 个叶子）＋ 100 个表块＝ 102.5 个逻辑读

性能提高百分比： 0.5% （也就是减少了 0.5 个逻辑读）

最好 clustering_factor （即该值等于表的数据块）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.0001*10000 （ 1 个叶子）＋ 0.0001*100000 （ 10 个表块）＝ 13 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.0001*5000 （ 1 个叶子）＋ 0.0001*100000 （ 10 个表块）＝ 12.5 个逻辑读

性能提高百分比： 3.8% （也就是减少了 0.5 个逻辑读）

3）如果通过索引获取 10000 条记录（占总记录数的 1% ）来说，分两种情况：

最差的 clustering_factor （即该值等于表的数据行数）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.01*10000 （ 100 个叶子）＋ 10000 个表块＝ 10102 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.01*5000 （ 50 个叶子）＋ 10000 个表块＝ 10052 个逻辑读

性能提高百分比： 0.5% （也就是减少了 50 个逻辑读）

最好 clustering_factor （即该值等于表的数据块）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.01*10000 （ 100 个叶子）＋ 0.01*100000 （ 1000 个表块）＝ 1102 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.01*5000 （ 50 个叶子）＋ 0.01*100000 （ 1000 个表块）＝ 1052 个逻辑读

性能提高百分比： 4.5% （也就是减少了 50 个逻辑读）

4）如果通过索引获取 100000 条记录（占总记录数的 10% ）来说，分两种情况：

最差的 clustering_factor （即该值等于表的数据行数）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.1*10000 （ 1000 个叶子）＋ 100000 个表块＝ 101002 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.1*5000 （ 500 个叶子）＋ 100000 个表块＝ 100502 个逻辑读

性能提高百分比： 0.5% （也就是减少了 500 个逻辑读）

最好 clustering_factor （即该值等于表的数据块）：

重建之前的成本： 1 个根＋ 1 个分支＋ 0.1*10000 （ 1000 个叶子）＋ 0.1*100000 （ 10000 个表块）＝ 11002 个逻辑读

重建之后的成本： 1 个根＋ 1 个分支＋ 0.1*5000 （ 500 个叶子）＋ 0.1*100000 （ 10000 个表块）＝ 10502 个逻辑读

性能提高百分比： 4.5% （也就是减少了 500 个逻辑读）

5）对于快速全索引扫描来说，假设每次获取 8 个数据块：

重建之前的成本：（ 1 个根＋ 40 个分支＋ 10000 个叶子） / 8 ＝ 1256 个逻辑读

重建之后的成本：（ 1 个根＋ 40 个分支＋ 5000 个叶子） / 8 ＝ 631 个逻辑读
性能提高百分比： 49.8% （也就是减少了 625 个逻辑读）

从上面有关性能提高的理论描述可以看出，对于通过索引获取的记录行数不大的情况下，索引碎片对于性能的影响非常小；当通过索引获取较大的记录行数时，索引碎片的增加可能导致对于索引逻辑读的增加，但是索引读与表读的比例保持不变；同时，我们从中可以看到， clustering_factor 对于索引读取的性能有很大的影响，并且对于索引碎片所带来的影响具有很大的作用；最后，看起来，索引碎片似乎对于快速全索引扫描具有最大的影响。

我们来看两个实际的例子，分别是 clustering_factor 为最好和最差的两个例子。测试环境为 8KB 的数据块，表空间采用 ASSM 的管理方式。先做一个最好的 clustering_factor 的例子，创建测试表并填充 1 百万条数据。

SQL> create table rebuild_test(id number,name varchar2(10));

SQL> begin

 2    for i in 1..1000000 loop

 3        insert into rebuild_test values(i,to_char(i));

 4            if mod(i,10000)=0 then

 5                commit;

 6            end if;

 7    end loop;

 8 end;

 9 /

该表具有 1 百万条记录，分布在 2328 个数据块中。同时由于我们的数据都是按照顺序递增插入的，所以可以知道，在 id 列上创建的索引都是具有最好的 clustering_factor 值的。我们运行以下查询测试语句，分别返回 1 、 100 、 1000 、 10000 、 50000 、 100000 以及 1000000 条记录。

select * from rebuild_test where id = 10;

select * from rebuild_test where id between 100 and 199;

select * from rebuild_test where id between 1000 and 1999;

select * from rebuild_test where id between 10000 and 19999;

select /*+ index(rebuild_test) */ * from rebuild_test where id between 50000 and 99999;

select /*+ index(rebuild_test) */ * from rebuild_test where id between 100000 and 199999;

select /*+ index(rebuild_test) */ * from rebuild_test where id between 1 and 1000000;

select /*+ index_ffs(rebuild_test) */ id from rebuild_test where id between 1 and 1000000;

在运行这些测试语句前，先创建一个 pctfree 为 50% 的索引，来模拟索引碎片，分析并记录索引信息。

SQL> create index idx_rebuild_test on rebuild_test(id) pctfree 50;

SQL> exec dbms_stats.gather_table_stats(user,'rebuild_test',cascade=>true);

然后运行测试语句，记录每条查询语句所需的时间；接下来以 pctfree 为 10% 重建索引，来模拟修复索引碎片，分析并记录索引信息。

SQL> alter index idx_rebuild_test rebuild pctfree 10;

SQL> exec dbms_stats.gather_table_stats(user,'rebuild_test',cascade=>true);

接着再次运行这些测试语句，记录每条查询语句所需的时间。下表显示了两个索引信息的对比情况。

pctfree	Height	blocks	br_blks	lf_blks	pct_used	clustering_factor
50%	3	4224	8	4096	49%	2326
10%	3	2304	5	2226	90%	2326

下表显示了不同的索引下，运行测试语句所需的时间对比情况。

记录数	占记录总数的百分比	pctused(50%)	pctused(90 ％ )	性能提高百分比
1 条记录	0.0001%	0.01	0.01	0.00%
100 条记录	0.0100%	0.01	0.01	0.00%
1000 条记录	0.1000%	0.01	0.01	0.00%
10000 条记录	1.0000%	0.02	0.02	0.00%
50000 条记录	5.0000%	0.06	0.06	0.00%
100000 条记录	10.0000%	1.01	1.00	0.99%
1000000 条记录	100.0000%	13.05	11.01	15.63%
1000000 条记录 (FFS)	100.0000%	7.05	7.02	0.43%

上面是对最好的 clustering_factor 所做的测试，那么对于最差的 clustering_factor 会怎么样呢？我们将 rebuild_test 中的 id 值反过来排列，也就是说，比如对于 id 为 3478 的记录，将 id 改为 8743 。这样的话，就将把原来按顺序排列的 id 值彻底打乱，从而使得 id 上的索引的 clustering_factor 变成最差的。为此，我写了一个函数用来反转 id 的值。

create or replace function get_reverse_value(id in number) return varchar2 is

 ls_id varchar2(10);

 ls_last_item varchar2(10);

 ls_curr_item varchar2(10);

 ls_zero varchar2(10);

 li_len integer;

 lb_stop boolean;

begin

 ls_id := to_char(id);

 li_len := length(ls_id);

 ls_last_item := '';

 ls_zero := '';

 lb_stop := false;

 while li_len>0 loop

       ls_curr_item := substr(ls_id,li_len,1);

       if ls_curr_item = '0' and lb_stop = false then

           ls_zero := ls_zero || ls_curr_item;

       else

           lb_stop := true;

           ls_last_item:=ls_last_item||ls_curr_item;

       end if;

       ls_id := substr(ls_id,1,li_len-1);

       li_len := length(ls_id);

 end loop;

 return(ls_last_item||ls_zero);

end get_reverse_value;

接下来，我们创建我们第二个测试的测试表。并按照与第一个测试案例相同的方式进行测试。注意，对于测试查询来说，要把表名（包括提示里的）改为 rebuild_test_cf 。

SQL> create table rebuild_test_cf as select * from rebuild_test;

SQL> update rebuild_test_cf set name=get_reverse_value(id);

分享到：

（转）SQLite入门与分析(一) | （转）深入研究B树索引（五）

2010-11-18 15:10
浏览 930
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

数据结构与管理第十一章树(续).pdf: 常见的包括二叉树（每个节点最多有两个子节点）、平衡树（所有叶子节点都在同一层）、B树和B+树（通常用于数据库索引）、红黑树（一种自平衡的二叉搜索树）等。 3. 树的遍历：在树结构中，遍历是按照某种规则访问树...

java网盘源码: 这需要高效的文件索引和查询机制，可能使用到数据结构如B树或哈希表来优化性能。 4. 分享与协作：支持用户分享文件给其他用户或公众，可能有权限设置，如访问密码、预览权限等。这涉及到权限管理模型，如ACL...

JEDEC SPEC 最新版合集 DDR2/DDR3/DDR4/DDR5/LPDDR2/LPDDR3/LPDDR4(X)/LPDDR5(X): JESD79-2F DDR2 JESD79-3F DDR3 JESD79-4D DDR4 JESD79-5C DDR5 JESD209-2F LPDDR2 JESD209-3C LPDDR3 JESD209-4E LPDDR4 JESD209-4-1A LPDDR4X JESD209-5C LPDDR5(X)

COMSOL二维光子晶体角态研究：单胞与超胞能带计算及边界态与角态特性分析,COMSOL二维光子晶体角态研究：单胞与超胞能带计算及边界态与角态特性分析,comsol二维光子晶体角态单胞能带，超胞能: COMSOL二维光子晶体角态研究：单胞与超胞能带计算及边界态与角态特性分析,COMSOL二维光子晶体角态研究：单胞与超胞能带计算及边界态与角态特性分析,comsol二维光子晶体角态。单胞能带，超胞能带，边界态以及角态计算。 ,comsol;二维光子晶体;角态;单胞能带;超胞能带;边界态计算,基于Comsol的二维光子晶体角态及能带边界计算研究

六自由度机械臂抓取动作仿真与代码解析：抓取动画、关节参数变化及轨迹图解详解,六自由度机械臂抓取动作仿真指南：掌握两套代码实现动画与轨迹图模拟学习攻略,六自由度机械臂抓取动作仿真-8 两套关于抓取动作的: 六自由度机械臂抓取动作仿真与代码解析：抓取动画、关节参数变化及轨迹图解详解,六自由度机械臂抓取动作仿真指南：掌握两套代码实现动画与轨迹图模拟学习攻略,六自由度机械臂抓取动作仿真-8 两套关于抓取动作的代码，包括抓取动画、关节角、角速度、角加速度的变化仿真、以及抓取轨迹图简单易懂好上手～ ,六自由度机械臂;抓取动作仿真;抓取动画;关节角变化;角速度角加速度;抓取轨迹图;两套代码;简单易懂好上手,六自由度机械臂抓取动作仿真演示：代码与轨迹图解

ITC网络广播工具软件: ITC网络广播工具软件

Multisim四位密码锁电路仿真设计：设定、开锁与声光报警功能演示资料包,Multisim四位密码锁电路仿真设计：设定、输入、开锁与报警功能详解，附源文件、原理说明书与演示视频,multisim四位: Multisim四位密码锁电路仿真设计：设定、开锁与声光报警功能演示资料包,Multisim四位密码锁电路仿真设计：设定、输入、开锁与报警功能详解，附源文件、原理说明书与演示视频,multisim四位密码锁电路仿真设计功能： 1.通过拨码开关1进行初始密码设定。 2.通过拨码开关2输入密码，实现开锁判断。 3.如果密码正确，LED绿灯亮，表示开锁。 4.如果密码不正确，LED红灯亮，蜂鸣器鸣叫，声光报警。资料包含：仿真源文件+原理说明书+演示视频 ,四位密码锁电路、Multisim仿真设计、初始密码设定;拨码开关输入;开锁判断;LED灯显示;声光报警;仿真源文件;原理说明书;演示视频,Multisim四位密码锁电路仿真设计：初始密码设置与智能解锁功能的声光报警展示

上班摸鱼打卡模拟器微信小程序源码.zip: 俗话说，摸鱼摸的好，上班没烦恼，毕竟谁能拒绝带薪拉屎呢（手动狗头）这是一个云开发职场打工人专属上班摸鱼划水微信小程序源码，没有后台直接导入微信开发者工具即可运行，UI简约大气漂亮，只需登录微信公众平台配置完合法域名即可轻松上线。用户进入摸鱼小程序，可以自由设置薪资，上班时间、下班时间、发薪日、月工作天数以提醒自己摸鱼，全民打酱油，让自己成为摸鱼冠军，《商鞅摸鱼哲学》摸鱼不是自我放纵，而是个人实力的积蓄，我们的小目标是晚睡晚起小程序中的今日待办会提醒用户带薪拉屎和闲逛，下方展示的是距离休息日的天数，距离下一次发工资的天数和节日的天数。

【毕业设计】基于Java的开发的一个集合校园二手交易、拼车、失物招领等功能的app_pgj.zip: 【毕业设计】基于Java的开发的一个集合校园二手交易、拼车、失物招领等功能的app_pgj

PICkit3离线烧录流程: 个人记录：PICkit3离线烧录流程使用软件：MPLAB X IDE v5.30 记录时间：20250215

基于Matlab代码的电力系统状态估计与实验仿真研究：扩展卡尔曼滤波和无迹卡尔曼滤波在电力系统动态状态估计中的应用及效果分析,Matlab仿真实验研究：基于扩展卡尔曼滤波器与无迹卡尔曼滤波器对电力系统: 基于Matlab代码的电力系统状态估计与实验仿真研究：扩展卡尔曼滤波和无迹卡尔曼滤波在电力系统动态状态估计中的应用及效果分析,Matlab仿真实验研究：基于扩展卡尔曼滤波器与无迹卡尔曼滤波器对电力系统状态估计的影响及验证,状态估计电力系统状态估计 Matlab代码实验仿真研究电力系统由于测量值和传输误差，还有测量噪声的影响，会对状态估计产生影响。因此，需要对嘈杂的测量进行滤波，以获得准确的电力系统运行动态。本文使用扩展卡尔曼滤波器（EKF）和无迹卡尔曼滤波器（UKF）来估计电力系统的动态状态。扩展卡尔曼滤波EKF、无迹卡尔曼滤波UKF 利用扩展的无迹卡尔曼滤波器估计了动力系统的动态状态。对WECC 3机9总线系统和新英格兰10机39总线系统进行了案例研究。结果表明EKF和UKF都能准确地估计电力系统的动态状态。 ,核心关键词：状态估计; 电力系统状态估计; Matlab代码; 实验仿真; 测量值误差; 测量噪声; 扩展卡尔曼滤波器(EKF); 无迹卡尔曼滤波器(UKF); 动力系统; 动态状态估计; WECC 3机9总线系统; 新英格兰10机39总线系统。,Matlab

springboot在线考试--.zip: springboot在线考试--

台达DVP EH3与MS300 PLC&变频器通讯程序的全面解决方案,台达DVP EH3与MS300通讯程序：稳定可靠的频率控制与启停管理系统,台达DVP EH3与台达MS300通讯程序(TDEH-9: 台达DVP EH3与MS300 PLC&变频器通讯程序的全面解决方案,台达DVP EH3与MS300通讯程序：稳定可靠的频率控制与启停管理系统,台达DVP EH3与台达MS300通讯程序(TDEH-9) 可直接用于实际的程序，程序带注释，并附送触摸屏程序，有接线方式和设置，通讯地址说明等。程序采用轮询，可靠稳定器件：台达DVP EH3系列PLC，台达MS300系列变频器，昆仑通态7022Ni 功能：实现频率设定，启停控制，实际频率读取，加减速时间设定。资料：带注释程序，触摸屏程序，接线和设置说明，后续有技术咨询。 ,核心关键词：台达DVP EH3; 台达MS300; 通讯程序(TDEH-9); 轮询; 稳定; 频率设定; 启停控制; 实际频率读取; 加减速时间设定; 触摸屏程序; 接线方式; 设置说明; 技术咨询。,台达PLC与变频器通讯程序（带注释、触摸屏控制）

【python毕设】p100基于Pytorch+springboot+vue的声纹识别系统.zip: 项目资源包含：可运行源码+sql文件适用人群：学习不同技术领域的小白或进阶学习者；可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。项目具有较高的学习借鉴价值，也可拿来修改、二次开发。个人账户管理：支持用户注册、登录与个人信息编辑；提供密码找回及账号安全保护措施。声纹采集：利用麦克风设备录制用户的声纹样本；支持多种录音格式和质量调整，确保采集到清晰、准确的声纹数据。声纹模板库管理：建立和维护一个安全的声纹模板库；支持声纹模板的添加、删除、更新和查询操作。声纹比对与识别：运用深度学习算法对输入的声纹数据进行特征提取和匹配；实现快速、准确的声纹身份验证。多场景应用支持：适用于多种场景，如门禁系统、移动支付、远程登录等；可根据实际需求定制开发相应的应用场景。实时监控与报警：实时监控系统运行状态，包括声纹识别成功率、处理速度等指标；当出现异常情况时，及时发出报警信息。数据分析与报告生成：收集并分析声纹识别过程中的数据，如识别准确率、处理时间等；根据用户需求输出包含详细图表说明的专业级文档供下载打印保存。社区互动交流：设立论坛版块鼓励用户分享心得体会讨论热点话题；定期邀请行业专家举办线上讲座传授实用技巧知识。音乐筛选与推荐：集成音乐平台API，根据用户的浏览习惯和情绪状态推荐背景音乐，增强用户体验。数据可视化：提供交互式的数据可视化面板，使非技术用户也能轻松理解复杂的数据集，从而做出更明智的决策。

三相与多相开绕组永磁同步电机仿真模型的先进控制策略探讨与实现,三相与多相开绕组永磁同步电机的Simulink仿真模型与先进控制策略研究,开绕组电机，开绕组永磁同步电机仿真模型、simulink仿真共: 三相与多相开绕组永磁同步电机仿真模型的先进控制策略探讨与实现,三相与多相开绕组永磁同步电机的Simulink仿真模型与先进控制策略研究,开绕组电机，开绕组永磁同步电机仿真模型、simulink仿真共直流母线、独立直流母线，两相容错，三相容错控制，零序电流抑制，控制策略很多三相开绕组永磁同步电机，六相开绕组永磁同步电机五相开绕组永磁同步电机，五相开绕组电机 ,开绕组电机; 永磁同步电机仿真模型; simulink仿真; 共直流母线; 独立直流母线; 两相容错; 三相容错控制; 零序电流抑制; 控制策略; 六相开绕组永磁同步电机; 五相开绕组永磁同步电机,开绕组电机仿真研究：共直流母线与独立直流母线的容错控制策略

【毕业设计】基于Java的开发的网上汽车租赁管理系统_pgj.zip: 【毕业设计】基于Java的开发的网上汽车租赁管理系统_pgj

python打开csv文件: csv 模块是 Python 的标准库，无需额外安装。运行结果如下图： ['姓名', '年龄', '城市'] ['张三', '25', '北京'] ['李四', '30', '上海'] ['王五', '22', '广州']

【毕业设计】基于Java+Springboot+Vue的宠物领养系统_pgj.zip: 【毕业设计】基于Java+Springboot+Vue的宠物领养系统_pgj

让前端开发者学习“机器学习”！: 让前端开发者学习“机器学习”！

【毕业设计】基于Java的实现的以宠物为主体的论坛式的APP.zip: 【毕业设计】基于Java的实现的以宠物为主体的论坛式的APP

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论