`
winie
  • 浏览: 223155 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类
最新评论

用 Oracle 数据库 10g 通过回收浪费的空间、联机重组表格和评估增长的趋势,有效地在段中进行存储管理

阅读更多

近来,有人要求我评估一个与 Oracle 数据库竞争的 RDBMS。在供应商的演示过程中,观众认为“最棒”的特性是,对联机重组的支持 — 该产品可以联机重新部署数据块,以使段的等价物更简洁,并且不会影响当前的用户。

 

那时,Oracle 还没有在 Oracle9i 数据库中提供这种功能。但是现在,有了 Oracle 数据库 10g,就可以轻松地联机回收浪费的空间和压缩对象—正好适合于起步者。

 

不过,在检验该特性之前,让我们看一看处理这项任务的“传统的”方法。

 

当前惯例

 

考虑让我们看一个段,如一张表,其中填满了块,如图 1 所示。在正常操作过程中,删除了一些行,如图 2 所示。现有就有了许多浪费的空间:(i) 在表的上一个末端和现有的块之间,以及 (ii) 在块内部,其中还有一些没有删除的行。

 

图 1
图 1:分配给该表的块。用灰色正方形表示行。

 

Oracle 不会释放空间以供其他对象使用,有一条简单的理由:由于空间是为新插入的行保留的,并且要适应现有行的增长。被占用的最高空间称为最高使用标记 (HWM),如图 2 所示。

 

图 2
图 2:行后面的块已经删除了;HWM 仍保持不变。

 

但是,这种方法有两个主要的问题:

  • 当用户发出一个全表扫描时,Oracle 始终必须从段一直扫描到 HWM,即使它什么也没有发现。该任务延长了全表扫描的时间。
  • 当用直接路径插入行时 — 例如,通过直接加载插入(用 APPEND 提示插入)或通过 SQL*Loader 直接路径 — 数据块直接置于 HWM 之上。它下面的空间就浪费掉了。

在 Oracle9i 及其以前的版本中,可以通过删除表,然后重建表并重新加载数据来回收空间;或通过使用 ALTER TABLE MOVE 命令把表移动到一个不同的表空间中来回收空间。这两种处理方式都必须脱机进行。另外,可以使用联机表重组特性,但是这需要至少双倍的现有表空间。

 

在 10g中,该任务已经变得微不足道了;假如您的表空间中支持自动段空间管理 (ASSM),您现在可以缩小段、表和索引,以回收空闲块并把它们提供给数据库以作他用,让我们看看其中的缘由。

 

10g 中的段管理方式

 

设想有一个表 BOOKINGS,它保存有经由 Web 站点的联机登记。当一个登记确认后,就会把它存储在一个存档表 BOOKINGS_HIST 中,并从 BOOKINGS 表中删除该行。登记和确认之间的时间间隔依据客户有很大的不同,由于无法从删除的行获得足够的空间,因此许多行就插入到了表的 HWM 之上。

 

现在您需要回收浪费的空间。首先,准确地查明在可回收的段中浪费了多少空间。由于它是在支持 ASSM 的表空间中,您将不得不使用 DBMS_SPACE 包的 SPACE_USAGE 过程,如下所示:

declare

l_fs1_bytes number;
l_fs2_bytes number;
l_fs3_bytes number;
l_fs4_bytes number;
l_fs1_blocks number;
l_fs2_blocks number;
l_fs3_blocks number;
l_fs4_blocks number;
l_full_bytes number;
l_full_blocks number;
l_unformatted_bytes number;
l_unformatted_blocks number;
begin
dbms_space.space_usage(
segment_owner      => user,
segment_name       => 'BOOKINGS',
segment_type       => 'TABLE',
fs1_bytes          => l_fs1_bytes,
fs1_blocks         => l_fs1_blocks,
fs2_bytes          => l_fs2_bytes,
fs2_blocks         => l_fs2_blocks,
fs3_bytes          => l_fs3_bytes,
fs3_blocks         => l_fs3_blocks,
fs4_bytes          => l_fs4_bytes,
fs4_blocks         => l_fs4_blocks,
full_bytes         => l_full_bytes,
full_blocks        => l_full_blocks,
unformatted_blocks => l_unformatted_blocks,
unformatted_bytes  => l_unformatted_bytes
   );
dbms_output.put_line(' FS1 Blocks = '||l_fs1_blocks||' Bytes = '||l_fs1_bytes);
dbms_output.put_line(' FS2 Blocks = '||l_fs2_blocks||' Bytes = '||l_fs1_bytes);
dbms_output.put_line(' FS3 Blocks = '||l_fs3_blocks||' Bytes = '||l_fs1_bytes);
dbms_output.put_line(' FS4 Blocks = '||l_fs4_blocks||' Bytes = '||l_fs1_bytes);
dbms_output.put_line('Full Blocks = '||l_full_blocks||' Bytes = ||l_full_bytes);
end;
/
输出结果如下:
FS1 Blocks = 0 Bytes = 0
FS2 Blocks = 0 Bytes = 0
FS3 Blocks = 0 Bytes = 0
FS4 Blocks = 4148 Bytes = 0
Full Blocks = 2 Bytes = 16384

 

这个输出结果显示有 4,148 个块,具有 75-100% 的空闲空间 (FS4);没有其他空闲块可用。这里仅有两个得到完全使用的块。4,148 个块都可以回收。

 

接下来,您必须确保该表支持行移动。如果不支持,您可以使用如下命令来支持它:

alter table bookings enable row movement;

 

或通过 Administration 页上的 企业管理器 10g。您还要确保在该表上禁用所有基于行 id 的触发器,这是因为行将会移动,行 id 可能会发生改变。

 

最后,您可以通过以下命令重组该表中现有的行:

alter table bookings shrink space compact;

 

该命令将会在块内重新分配行,如图 3 所示,这就在 HWM 之下产生了更多的空闲块 — 但是 HWM 自身不会进行分配。

 

图 3
图 3:重组行后的表中的块。

 

在执行该操作后,让我们看一看空间利用率所发生的改变。使用在第一步展示的 PL/SQL 块,可以看到块现在是如何组织的:

FS1 Blocks = 0 Bytes = 0
FS2 Blocks = 0 Bytes = 0
FS3 Blocks = 1 Bytes = 0
FS4 Blocks = 0 Bytes = 0
Full Blocks = 2 Bytes = 16384

 

注意这里的重要改变:FS4 块(具有 75-100% 的空闲空间)的数量现在从 4,148 降为 0。我们还看到 FS3 块(具有 50-75% 的空闲空间)的数量从 0 增加到 1。但是,由于 HWM 没有被重置,总的空间利用率仍然是相同的。我们可以用如下命令检查使用的空间:

SQL> select blocks from user_segments where segment_name = 'BOOKINGS';

BLOCKS
---------
     4224

 

由该表占用的块的数量 (4,224) 仍然是相同的,这是因为并没有把 HWM 从其原始位置移开。可以把 HWM 移动到一个较低的位置,并用如下命令回收空间:

alter table bookings shrink space;

 

注意子句 COMPACT 没有出现。该操作将把未用的块返回给数据库并重置 HWM。可以通过检查分配给表的空间来对其进行测试:
SQL> select blocks from user_segments where segment_name = 'BOOKINGS';

BLOCKS
----------
         8

 

块的数量从 4,224 降为 8;该表内所有未用的空间都返回给表空间,以让其他段使用,如图 4 所示。

 

图 4
图 4:在收缩后,把空闲块返回给数据库。

 

这个收缩操作完全是在联机状态下发生的,并且不会对用户产生影响。

 

也可以用一条语句来压缩表的索引:
alter table bookings shrink space cascade;

 

联机 shrink 命令是一个用于回收浪费的空间和重置 HWM 的强大的特性。我把后者(重置 HWM)看作该命令最有用的结果,因为它改进了全表扫描的性能。

 

找到收缩合适选择

 

在执行联机收缩前,用户可能想通过确定能够进行最完全压缩的段,以找出最大的回报。只需简单地使用 dbms_space 包中的内置函数 verify_shrink_candidate。如果段可以收缩到 1,300,000 字节,则可以使用下面的 PL/SQL 代码进行测试:
begin
if (dbms_space.verify_shrink_candidate
('ARUP','BOOKINGS','TABLE',1300000)
then
:x := 'T';
else 
:x := 'F';
end if;
end;
/

PL/SQL 过程成功完成。

SQL> print x

X
--------------------------------
T

 

如果目标收缩使用了一个较小的数,如 3,000:
begin
if (dbms_space.verify_shrink_candidate
('ARUP','BOOKINGS','TABLE',30000)
then
:x := 'T';
else 
:x := 'F';
end if;
end;

 

变量 x 的值被设置成 'F',意味着表无法收缩到 3,000 字节。

 

推测一下来自索引空间的需要

 

现在假定您将着手在一个表上,或者也许是一组表上创建一个索引的任务。除了普通的结构元素,如列和单值性外,您将不得不考虑的最重要的事情是索引的预期大小 — 必须确保表空间有足够的空间来存放新索引。

 

在 Oracle 数据库 9i 及其以前的版本中,许多 DBA 使用了大量的工具(从电子数据表到独立程序)来估计将来索引的大小。在 10g中,通过使用 DBMS_SPACE 包,使这项任务变得极其微不足道。让我们看一看它的作用方式。

 

我们要求在 BOOKINGS 表的 booking_id 和 cust_name 列上创建一个索引。这个提议的索引需要多少空间呢?您所需要做的全部工作就是执行下面的 PL/SQL 脚本。
declare
l_used_bytes number;
l_alloc_bytes number;
begin
dbms_space.create_index_cost (
ddl => 'create index in_bookings_hist_01 on bookings_hist '||
'(booking_id, cust_name) tablespace users',
used_bytes => l_used_bytes,
alloc_bytes => l_alloc_bytes
   );
dbms_output.put_line ('Used Bytes      = '||l_used_bytes);
dbms_output.put_line ('Allocated Bytes = '||l_alloc_bytes);
end;
/   

 

The output is:
Used Bytes      = 7501128
Allocated Bytes = 12582912

 

假定您想使用一些参数,而这些将参数潜在地增加了索引的大小,例如,指定 INITRANS 参数为 10。
declare
l_used_bytes number;
l_alloc_bytes number;
begin
dbms_space.create_index_cost (
ddl => 'create index in_bookings_hist_01 on bookings_hist '||
'(booking_id, cust_name) tablespace users initrans 10',
used_bytes => l_used_bytes,
alloc_bytes => l_alloc_bytes
   );
dbms_output.put_line ('Used Bytes      = '||l_used_bytes);
dbms_output.put_line ('Allocated Bytes = '||l_alloc_bytes);
end;
/

 

输出结果如下:
Used Bytes      = 7501128
Allocated Bytes = 13631488

 

注意通过指定一个更高的 INITRANS,而导致的分配字节的增加。使用这种方法可以容易地确定索引对存储空间的影响。

 

但是,您应该意识到两个重要的警告。第一,该过程只适用于打开了 SEGMENT SPACE MANAGEMENT AUTO 的表空间。第二,包是依据表上的统计来计算索引的估计大小。因此,对表执行相对新的统计是非常重要的。但请注意:如果没有对表的统计,不会导致使用包时出错,但会产生一个错误的结果。

 

估计表的大小

 

假定有一个名为 BOOKINGS_HIST 的表,它共有 30,000 行,各行长度较为平均,并且 PCTFREE 参数值为 20。如果想把参数 PCT_FREE 增至 30,表格的大小将增加多少?由于 30 是将 20 增长了 10%,表格大小将会按 10% 的比例增长吗?这个问题不要问自己,而要问 DBMS_SPACE 包内的 CREATE_TABLE_COST 过程。下面是您能够估计大小的方法:
declare
l_used_bytes number;
l_alloc_bytes number;
begin
dbms_space.create_table_cost (
tablespace_name => 'USERS',
avg_row_size => 30,
row_count => 30000,
pct_free => 20,
used_bytes => l_used_bytes,
alloc_bytes => l_alloc_bytes
   );
dbms_output.put_line('Used:'||l_used_bytes);
dbms_output.put_line('Allocated:'||l_alloc_bytes);
end;
/

 

输出结果如下:
Used: 1261568
Allocated: 2097152

 

要把表的 PCT_FREE 参数从 20 更改为 30,可以通过指定
pct_free => 30

 

我们得到了输出结果:
Used: 1441792
Allocated: 2097152

 

注意:使用的空间已从 1,261,568 增加到 1,441,792,这是由于 PCT_FREE 参数在用户数据的数据块中保留了较少的空间。增量大约有 14%,而不是所预期的 10%。使用这个包可以容易地计算出参数(如 PCT_FREE)对表大小的影响,或把该表移动到一个不同的表空间中的影响。

 

预测段的增长

 

这是一个假日的周末,Acme 酒店期待有如同潮涌般的人群要求入住。作为一名 DBA,您正设法了解这种需求,以使您能够确保有足够的空间可供使用。如何预测表的空间利用率呢?

 

只需询问 10g;您就会惊诧于它能够多么准确和聪明地为您作出预测。只需简单地发出查询:
select * from 
table(dbms_space.OBJECT_GROWTH_TREND 
('ARUP','BOOKINGS','TABLE'));

 

函数 dbms_space.object_growth_trend() 将以 PIPELINEd 格式返回记录,这种格式可以通过 TABLE() 强制转换将其显示出来。输出如下:

 

TIMEPOINT                      SPACE_USAGE SPACE_ALLOC QUALITY
------------------------------ ----------- ----------- ------------
05-MAR-04 08.51.24.421081 PM       8586959    39124992 INTERPOLATED
06-MAR-04 08.51.24.421081 PM       8586959    39124992 INTERPOLATED
07-MAR-04 08.51.24.421081 PM       8586959    39124992 INTERPOLATED
08-MAR-04 08.51.24.421081 PM     126190859  1033483971 INTERPOLATED
09-MAR-04 08.51.24.421081 PM       4517094     4587520 GOOD
10-MAR-04 08.51.24.421081 PM     127469413  1044292813 PROJECTED
11-MAR-04 08.51.24.421081 PM     128108689  1049697234 PROJECTED
12-MAR-04 08.51.24.421081 PM     128747966  1055101654 PROJECTED
13-MAR-04 08.51.24.421081 PM     129387243  1060506075 PROJECTED
14-MAR-04 08.51.24.421081 PM     130026520  1065910496 PROJECTED

 

输出结果多次清楚显示了 BOOKINGS 表的大小,就像在 TIMEPOINT 列、TIMESTAMP 数据类型中所显示的那样。SPACE_ALLOC 列显示了分配给该表的字节,而 SPACE_USAGE 列显示了已使用了多少字节。该信息是由自动负载存储或 AWR(参阅本系列中的第 6 周)每天进行收集的。在上面的输出中,数据是在 2004 年 3 月 9 日收集好的,就像 QUALITY 列的值 - "GOOD" 所指示的那样。那一天的空间分配和使用数字都是准确无误的。但是,以后的日子,该列的值将是 PROJECTED,这表示空间计算是由 AWR 功能依据收集的数据进行预测的 — 不是直接从段进行收集。

 

注意 3 月 9 日以前的该列中的值 — 全都是 INTERPOLATED。换句话说,该值没有真正收集或预测的值,只是简单地依据适用于任何可用数据的使用图案添加进去的。最有可能的是当时没有数据,因此不得不添加该值。

 

结论

 

有了段级操作,现在就能对段内空间如何使用进行细粒度的控制,可用来回收表内的空闲空间、联机重组表中的行以使之更压缩,以及更多操作。这些功能帮助 DBA 从诸如表重组之类的日常任务中解脱出来。联机段收缩特性在估计内部碎片和降低段的最高使用标记方面特别有用,能显著地减少全表扫描的成本。

 

么获取关于 SHRINK 操作的更多信息,请参阅 Oracle 数据库 SQL 参考 中的这部分的内容。可以在 PL/SQL 包和类型参考第 88 章中了解到有关 DBMS_SPACE 包的更多信息。为了对 Oracle 数据库 10g中的所有新的空间管理特性作一个全面的回顾,可以阅读技术白皮书自我管理的数据库:积极的空间和模式对象管理。最后,在线提供了一个 Oracle 数据库 10g 空间管理的演示。

 

分享到:
评论

相关推荐

    基于springboot教育资源共享平台源码数据库文档.zip

    基于springboot教育资源共享平台源码数据库文档.zip

    视频笔记linux开发篇

    linux开发篇,配套视频:https://www.bilibili.com/list/474327672?sid=4493702&spm_id_from=333.999.0.0&desc=1

    readera-24-09-08plus2020.apk

    ReadEra 这个阅读应用能够打开下列任何格式的文档: EPUB, PDF, DOC, RTF, TXT, DJVU, FB2, MOBI, 和 CHM. 基本上来说,你可以用它阅读你的设备内存中的任何书籍或者文本文档。 这个应用与划分成章节的文档兼。,有一个书签功能,可以在你阅读的时候,自动保存你的进度。另外,它让你更改页面模式,从几种不同的主题中进行挑选(夜间,白天,棕黑色调,还有控制台)。

    STM32单片机控制舵机旋转

    软件环境:KEIL4 硬件环境:STM32单片机+舵机 控制原理:通过控制输出信号的占空比调节舵机旋转的角度

    基于springboot仓库管理系统源码数据库文档.zip

    基于springboot仓库管理系统源码数据库文档.zip

    酒店管理系统源码C++实现的毕业设计项目源码.zip

    酒店管理系统源码C++实现的毕业设计项目源码.zip,个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分98.5分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。 酒店管理系统源码C++实现的毕业设计项目源码.zip,酒店管理系统源码C++实现的毕业设计项目源码.zip个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分98.5分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。酒店管理系统源码C++实现的毕业设计项目源码.zip酒店管理系统源码C++实现的毕业设计项目源码.zip酒店管理系统源码C++实现的毕业设计项目源码.zip,个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分98.5分。主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。酒店管理系统源码C++实现的毕业设计项目源码.zip,个人大四的毕业设计、经导师指导并认可通过的高分设计项目,评审分98.5分。主要针对计算机相关专业的正在做毕

    58商铺全新UI试客试用平台网站源码

    58商铺全新UI试客试用平台网站源码

    基于SpringBoot+Vue的轻量级定时任务管理系统.zip

    springboot vue3前后端分离 基于SpringBoot+Vue的轻量级定时任务管理系统.zip

    毕业设计&课设_微博情感分析,用 flask 构建 restful api,含相关算法及数据文件.zip

    该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过严格测试运行成功才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

    4D毫米波雷达点云数据处理方法研究.caj

    4D毫米波雷达点云数据处理方法研究.caj

    S M 2 2 5 8 X T量产工具

    S M 2 2 5 8 X T 量产工具供大家下载使用

    基于springboot的文物管理系统源码数据库文档.zip

    基于springboot的文物管理系统源码数据库文档.zip

    基于springboot的电影院售票管理系统源码数据库文档.zip

    基于springboot的电影院售票管理系统源码数据库文档.zip

    Javaweb仓库管理系统项目源码.zip

    基于Java web 实现的仓库管理系统源码,适用于初学者了解Java web的开发过程以及仓库管理系统的实现。

    美容美发项目,使用django框架,前后端一体化项目

    美容美发项目,使用django框架,前后端一体化项目

    2023年中国在线票务行业市场规模约为24.99亿元,挖掘市场新机遇

    在线票务:2023年中国在线票务行业市场规模约为24.99亿元,挖掘市场蓝海新机遇 在数字浪潮的席卷下,传统的票务销售模式正经历着前所未有的变革。纸质门票逐渐淡出人们的视野,取而代之的是便捷、高效的数字和移动票务。这一转变不仅为消费者带来了前所未有的购票体验,更为在线票务平台开辟了广阔的发展空间和市场机遇。随着国民经济的持续增长和文体娱乐行业的蓬勃发展,中国在线票务行业正站在时代的风口浪尖,等待着每一位有志之士的加入。那么,这片蓝海市场究竟蕴藏着怎样的潜力?又该如何把握机遇,实现突破?让我们一同探索。 市场概况: 近年来,中国在线票务行业市场规模持续扩大,展现出强劲的增长势头。据QYResearch数据显示,2023年中国在线票务行业市场规模约为24.99亿元,尽管受到宏观经济的影响,市场规模增速放缓,但整体趋势依然向好。这一增长主要得益于国民人均收入的不断提高、电影及演出行业的快速发展以及政府政策的支持。例如,2023年财政部、国家电影局发布的《关于阶段性免征国家电影事业发展专项资金政策的公告》,为电影行业注入了强劲动力,进而推动了在线票务市场规模的扩大。 技术创新与趋势: 技术进步

    基于SpringBoot的养老院管理系统源码数据库文档.zip

    基于SpringBoot的养老院管理系统源码数据库文档.zip

    毕业设计&课设_含构建设置及相关操作,基于特定技术,具体功能未详细说明.zip

    该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过严格测试运行成功才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

    Go语言入门指南:基础语法、并发编程详解

    内容概要:本文档是一份详细的Go语言教程,从基础概念介绍到高级主题均有覆盖。主要内容包括Go语言的基础语法、数据类型、控制结构、函数、结构体、接口和并发编程等方面。通过具体示例介绍了如何使用Go语言进行开发。 适合人群:初学者和有一定经验的程序员都可以从这篇教程中受益,特别是那些想要快速掌握Go语言并应用于实际项目的开发者。 使用场景及目标:适用于初学者系统学习Go语言的基础知识和常用功能;也可以作为已有开发经验者的参考资料,帮助他们解决具体的编程问题,提高开发效率。 其他说明:本教程不仅包含了Go语言的基本知识点,还重点讲解了其独特的并发编程模型。读者在学习过程中应该注重理论与实践相结合,通过实际编写代码来加深理解和记忆。

    基于springboot计算机基础网上考试系统源码数据库文档.zip

    基于springboot计算机基础网上考试系统源码数据库文档.zip

Global site tag (gtag.js) - Google Analytics