`
luozhong915127
  • 浏览: 189141 次
  • 性别: Icon_minigender_1
  • 来自: 湖南
文章分类
社区版块
存档分类
最新评论

B树第三节学习(插入与删除的思路与理论)

阅读更多

B树的插入、删除操作

 

     上面第2小节学习简单介绍了利用B树这种结构如何访问外存磁盘中的数据的情况,下面咱们通过另外一个实例来对这棵B树的插入(insert,删除(delete)基本操作进行详细的介绍。

 

    但在此之前,咱们还得简单回顾下一棵m阶的 (m叉树)的特性,如下:

 

1.    树中每个结点含有最多含有m个孩子,即m满足:ceil(m/2)<=m<=m

 

2.    除根结点和叶子结点外,其它每个结点至少有[ceil(m / 2)]个孩子(其中ceil(x)是一个取上限的函数);

 

3.    若根结点不是叶子结点,则至少有2个孩子(特殊情况:没有孩子的根结点,即根结点为叶子结点,整棵树只有一个根节点);

 

4.    所有叶子结点都出现在同一层,叶子结点不包含任何关键字信息(可以看做是外部接点或查询失败的接点,实际上这些结点不存在,指向这些结点的指针都为null)

 

5.    每个非终端结点中包含有n个关键字信息: (nP0K1P1K2P2......KnPn)。其中:

 


      a)   Ki (i=1...n)

 

为关键字,且关键字按顺序升序排序K(i-1)< Ki

 

 

 
       b)   Pi
为指向子树根的接点,且指针P(i-1)指向子树种所有结点的关键字均小于Ki,但都大于K(i-1)
 

 


       c)  

 

除根结点之外的结点的关键字的个数n必须满足: [ceil(m / 2)-1]<= n <= m-1叶子结点也必须满足此条关于关键字数的性质,根结点除外)。

 

 

 

      那好!下面咱们以一棵5阶(即树中任一结点至多含有4个关键字,5棵子树B树实例进行讲解(如下图所示)

备注:

1.    关键字数(2-4个)针对--非根结点(包括叶子结点在内),孩子数(3-5个)--针对根结点和叶子结点之外的内结点。当然,根结点是必须至少有2个孩子的,不然就成直线型搜索树了

2.    曾在一次面试中被问到,一棵含有N个总关键字数的m阶的B树的最大高度是多少?答曰:log_ceilm/2N (上面中关于mB树的第1点特性已经提到:树中每个结点含有最多含有m个孩子,即m满足:ceil(m/2)<=m<=m。而树中每个结点含孩子数越少,树的高度则越大,故如此)。在2012微软4月份的笔试中也问到了此问题。更多原理请看上文第3小节末:B树的高度。

下图中关键字为大写字母,顺序为字母升序。

结点定义如下:

typedef struct{ int Count; // 当前节点中关键元素数目 ItemType Key[4]; // 存储关键字元素的数组 long Branch[5]; // 伪指针数组,(记录数目)方便判断合并和分裂的情况 } NodeType;


 

 

如图:



 

 

插入(insert)操作

    插入一个元素时,首先在B树中是否存在,如果不存在,即在叶子结点处结束,然后在叶子结点中插入该新的元素,注意:如果叶子结点空间足够,这里需要向右移动该叶子结点中大于新插入关键字的元素,如果空间满了以致没有足够的空间去添加新的元素,则将该结点进行分裂,将一半数量的关键字元素分裂到新的其相邻右结点中,中间关键字元素上移到父结点中(当然,如果父结点空间满了,也同样需要分裂操作),而且当结点中关键元素向右移动了,相关的指针也需要向右移。如果在根结点插入新元素,空间满了,则进行分裂操作,这样原来的根结点中的中间关键字元素向上移动到新的根结点中,因此导致树的高度增加一层。如下图所示:

    1OK,下面咱们通过一个实例来逐步讲解下。插入以下字符字母到一棵空的树中(非根结点关键字数小了(小于2个)就合并,大了(超过4个)就分裂):C N G A H E K Q M F W L T Z D P R X Y S,首先,结点空间足够,4个字母插入相同的结点中,如下图:


 

       2、当咱们试着插入H时,结点发现空间不够,以致将其分裂成2个结点,移动中间元素G上移到新的根结点中,在实现过程中,咱们把AC留在当前结点中,而HN放置新的其右邻居结点中。如下图:

 

 

 

       3、当咱们插入E,K,Q时,不需要任何分裂操作。 如图:

 

 


 
 

        4、插入M需要一次分裂,注意M恰好是中间关键字元素,以致向上移到父节点中。如图:

 

 

 

        5、插入F,W,L,T不需要任何分裂操作。如图:

 

 

 

       6、插入Z时,最右的叶子结点空间满了,需要进行分裂操作,中间元素T上移到父节点中,注意通过上移中间元素,树最终还是保持平衡,分裂结果的结点存在2个关键字元素。如图:



 

 

 

       7、插入D时,导致最左边的叶子结点被分裂,D恰好也是中间元素,上移到父节点中,然后字母P,R,X,Y陆续插入不需要任何分裂操作(别忘了,树中至多5个孩子)。如图:


 

 

       8、最后,当插入S时,含有N,P,Q,R的结点需要分裂,把中间元素Q上移到父节点中,但是情况来了,父节点中空间已经满了,所以也要进行分裂,将父节点中的中间元素M上移到新形成的根结点中,注意以前在父节点中的第三个指针在修改后包括DG节点中。这样具体插入操作的完成,下面介绍删除操作,删除操作相对于插入操作要考虑的情况多点。如图:


 

 

 

删除(delete)操作


1)删除操作的两个步骤
   
  第一步骤:在树中查找被删关键字K所在的地点
   
 第二步骤:进行删去K的操作

2)删去K的操作
   
 B-树是二叉排序树的推广,中序遍历B-树同样可得到关键字的有序序列(具体遍历算法【参见练习】)。任一关键字K的中序前趋(后继)必是K的左子树(右子树)中最右()下的结点中最后(最前)一个关键字。


   
 若被删关键字K所在的结点非树叶,则用K的中序前趋(或后继)K'取代K,然后从叶子中删去K'。从叶子*x开始删去某关键字K的三种情形为:


   
 情形一:若x->keynum>Min,则只需删去K及其右指针(*x是叶子,K的右指针为空)即可使删除操作结束。

 

 

 

注意: Min=【M/2】-1


   
 情形二:若x->keynum=Min,该叶子中的关键字个数已是最小值,删K及其右指针后会破坏B-树的性质(3)。若*x的左(或右)邻兄弟结点*y中的关键字数目大于Min,则将*y中的最大(或最小)关键字上移至双亲结点*parent中,而将*parent中相应的关键字下移至x中。显然这种移动使得双亲中关键字数目不变;*y被移出一个关键字,故其keynum1,因它原大于Min,故减少1个关键字后keynum仍大于等于Min;而*x中已移入一个关键字,故删K*x中仍有Min个关键字。涉及移动关键字的三个结点均满足B-树的性质(3) 请读者验证,上述操作后仍满足B-树的性质(1)。移动完成后,删除过程亦结束。


   
 情形三:若*x及其相邻的左右兄弟(也可能只有一个兄弟)中的关键字数目均为最小值Min,则上述的移动操作就不奏效,此时须*x和左或右兄弟合并。不妨设*x有右邻兄弟*y(对左邻兄弟的讨论与此类似),在*x中删去K后,将双亲结点*parent中介于*x*y之间的关键字K,作为中间关键字,与并x*y中的关键字一起"合并"为一个新的结点取代*x*y。因为*x*y原各有Min个关键字,从双亲中移人的K'抵消了从*x中删除的K,故新结点中恰有2Min(2m/2-2≤m-1)个关键字,没有破坏B-树的性质(3)。但由于K'从双亲中移到新结点后,相当于从*parent中删去了K',若parent->keynum原大于Min,则删除操作到此结束;否则,同样要通过移动*parent的左右兄弟中的关键字或将*parent与其 左右兄弟合并的方法来维护B-树性质。最坏情况下,合并操作会向上传播至根,当根中只有一个关键字时,合并操作将会使根结点及其两个孩子合并成一个新的根,从而使整棵树的高度减少一层。如图:
   
 

 

     
 
分析:
 
    1个被删的关键字h是在叶子中,且该叶子的keynum>Min(5B-树的Min=2),故直接删去即可。第2个删去的r不在叶子中,故用中序后继s取代r,即把s复制到r的位置上,然后从叶子中删去s。第3个删去的p所在的叶子中的关键字数目是最小值Min,但其右兄弟的keynum>Min,故可以通过左移,将双亲中的s移到p所在的结点,而将右兄弟中最小(即最左边)的关键字t上移至双亲取代s。当删去d时,d所在的结点及其左右兄弟均无多余的关键字,故需将删去d后的结点与这两个兄弟中的一个(图中是选择左兄弟(ab))及其双亲中分隔这两个被合并结点的关键字c合并在一起形成一个新结点(abce)。但因为双亲中失去ckeynum<Min,故必须对该结点做调整操作,此时它只有一个右兄弟,且右兄弟无多余的关键字,不可能通过移动关键字来解决。因此引起再次合并,因根只有一个关键字,故合并后树高度减少一层,从而得到上图的最后一个图。

  • 大小: 7.5 KB
  • 大小: 15.8 KB
  • 大小: 66.6 KB
  • 大小: 3.3 KB
  • 大小: 6.7 KB
  • 大小: 8.4 KB
  • 大小: 9.1 KB
  • 大小: 10.2 KB
  • 大小: 12.3 KB
  • 大小: 16.9 KB
  • 大小: 19.9 KB
1
4
分享到:
评论
2 楼 luozhong915127 2012-08-25  
fwmlove 写道
7、插入D时...
8、最后...
这两个步骤的配图顺序错了。

对头上传图片的时候搞错了,以后要注意。谢谢!
1 楼 fwmlove 2012-08-20  
7、插入D时...
8、最后...
这两个步骤的配图顺序错了。

相关推荐

    第5章学习指导与习题1

    综上所述,第5章的学习指导与习题1为学生提供了全面且深入的学习资源,旨在帮助他们在查找算法和数据结构领域打下坚实的基础。掌握这些基础知识对于未来在数学和大数据等专业领域的发展至关重要。随着数据量的不断...

    算法设计与分析 中文版教程

    #### 一、课程概述与学习目标 **标题:“算法设计与分析 中文版教程”** 本教程旨在系统介绍算法设计与分析的基础知识、核心技术及实践应用,适合计算机科学及相关专业学生作为教材使用。通过本教程的学习,读者...

    算法导论(part1)

    第三部分 数据结构 引言 第10章 基本数据结构 10.1 栈和队列 10.2 链表 10.3 指针和对象的实现 10.4 有根树的表示 第11章 散列表 11.1 直接寻址表 11.2 散列表 11.3 散列函数 11.3.1 除法散列法...

    数据结构与算法分析_java语言描述课后答案(英文)

    - **第四章:树** —— 深入讨论了树的各种类型(如二叉树、平衡树等)及其操作,如遍历、插入和删除。 - **第五章:散列** —— 介绍了散列表的工作原理、散列函数的设计以及处理冲突的方法。 - **第六章:优先队列...

    数据结构1800题(内含解题答案)

    这些题目涵盖了数据结构的各个重要概念,包括线性结构、树形结构、图结构、查找与排序等基础理论,以及在实际问题中应用这些结构的方法。 1. **线性结构**:线性结构是最基础的数据结构,如数组和链表。数组提供...

    数据结构算法实现(严蔚敏版配套实现程序)

    3. **树结构**:二叉树、平衡二叉树(如AVL树和红黑树)、B树、B+树等,它们在文件系统、数据库索引等方面应用广泛。 4. **图结构**:图可以用来表示复杂的关联关系,例如在网络路由、社交网络分析等领域有重要应用...

    基于B+树的动态数据持有性证明方案

    方案的核心思路是利用B+树的节点索引值进行优化,使第三方检测机构能够识别错误数据并进行精确定位。与基于Merkel哈希树的方案相比,引入的B+树结构在构造认证数据结构时能够显著降低时间开销。此外,该方案简化了...

    北航软件学院自主招生1月研究生入学考试数据结构+C语言真题

    3. **B-树插入** - B-树是一种自平衡的多路搜索树,插入操作可能导致结点分裂。 - 插入20后,根据B-树的性质,需要重新调整树的结构。 4. **希尔排序** - 希尔排序是一种基于插入排序的改进算法,通过设定不同的...

    最经典的数据结构演示程序

    5. **树**:数据以分层方式组织,如二叉树、平衡树(AVL树、红黑树)、B树等,适用于搜索和排序操作。 6. **图**:用于表示对象之间的复杂关系,如邻接矩阵或邻接表,用于路由、社交网络分析等。 7. **哈希表**:...

    实用算法设计与分析

    课程强调理论与实践相结合,注重算法的设计思路与实现技巧。 - **课程性质**:作为一门专业基础课,采取至少8%末尾淘汰制,确保学生能够充分掌握核心知识点。课程总学时为60/30,共计3个学分。 - **课程内容**:...

    数据结构与算法(JAVA语言版)(中文版)

    本章节作为开篇,旨在为读者打下坚实的Java编程基础,为后续深入学习数据结构与算法奠定理论基石。 ##### 1.1 Java语言基础知识 **1.1.1 基本数据类型及运算** 介绍了Java中的基本数据类型,包括整型(如`int`)...

    数据结构与算法分析答案(英文 C++版)(第二版)

    根据给定文件的信息,我们可以详细地探讨这本《数据结构与算法分析答案(英文 C++版)(第二版)》中的关键知识点。 ### 数据结构与算法分析答案(英文 C++版)(第二版) #### 书籍概述 这本书是《数据结构与...

    数据库卷子 a,b,c,d一共四套有习题和答案

    在试题A中,可能会涉及数据库范式理论,如第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及巴斯-科德范式(BCNF)。理解这些范式有助于消除数据冗余和提高数据一致性。此外,还有可能测试关系代数、元组演算...

    Java数据结构和算法(第二版)

    《Java数据结构和算法(第二版)》是深入学习编程基础和优化问题解决能力的重要教材。本书主要聚焦于使用Java语言来实现和理解各种经典的数据结构和算法,这对于提升编程能力,尤其是解决复杂问题的能力至关重要。 ...

    计算机四级数据库工程师模拟试题及历年真题和答案附解析.

    它涉及到关系模型、第一范式(1NF)、第二范式(2NF)、第三范式(3NF)以及BCNF(巴斯-科德范式),理解这些范式对于设计规范化的关系数据库至关重要。此外,还要熟悉E-R图(实体-关系模型)和关系代数,这是数据库...

    北航软院2008数据结构与C语言程序设计试题与答案

    4. **B-树的插入操作**:B-树是一种自平衡的树数据结构,常用于数据库和文件系统中。B-树的插入操作需要保持树的平衡性和节点的有序性。 #### 算法设计题知识点解析 1. **最后k个元素的输出**:此题旨在考察如何...

Global site tag (gtag.js) - Google Analytics