在2-3树中,每个内部节点(非叶子节点)有两个或三个孩子,而且所有叶子都在同一级别上。例如,图1显示高度为3的2-3树。包含两个孩子的节点称为2-节点,二叉树中的节点都是2-节点;包含三个孩子的节点称为3-节点。
图1:高度为3的2-3树
2-3树不是二叉树,其节点可拥有3个孩子。不过,2-3树与满二叉树相似。若某棵2-3树不包含3-节点,则看上去像满二叉树,其所有内部节点都可有两个孩子,所有的叶子都在同一级别。另一方面,2-3树的一个内部节点确实有3个孩子,故比相同高度的满二叉树的节点更多。高为h的2-3树包含的节点数大于等于高度为h的满二叉树的节点数,即至少有2^h-1个节点。换一个角度分析,包含n的节点的2-3树的高度不大于[log2(n+1)](即包含n个节点的二叉树的最小高度)。
由此可知,2-3树可用于ADT列表的实现。若2-3树排序节点,使之成为一棵查找树,就可以用来实现ADT表。下面是2-3树的递归定义,它指定了节点的顺序。
如果满足下面的条件之一,T就是一棵2-3树:
(1)T为空,即高为0的2-3树。
或者
(2)T的形式:
其中r是包含一个数据项的节点,TL和TR各是高为h-1的2-3树。此时,r中的查找关键字必须大于子树TL中的查找关键字,并小于TR中的查找关键字。
或者
(3)T的形式为:
其中,r是包含两个数据项的节点,而TM、TL和TR各是高为h-1的2-3树。此时,r中的较小查找关键字必须大于左子树TL中的各个查找关键字,并小于种子数TM中的各个查找关键字。r中的较大查找关键字必须大于中子树TM中的各个查找关键字,并小于右子树TR中的各个查找关键字。
由此定义,可推出将数据项放入2-3树节点中的规则:
(1)2-节点有两个孩子,必含一个数据项,其查找关键字大于左孩子的查找关键字,而小于右孩子的查找关键字,如图2-a所示:
(2)3-节点有三个孩子 ,必含两个数据项,其查找关键字S和L满足下列关系:S大于左孩子的查找关键字,而小于中孩子的查找关键字;L大于中孩子的查找关键字,而小于右孩子的查找关键字。如图2-b所示:
(3)叶子可以包含一个或两个数据项。
(a)2-节点(b) 3-节点
图2 :2-3树的节点;
图3:一棵2-3树
这样,2-3树的项按查找关键字排序。例如,图3是一棵2-3树。
可用下面的c++语句表示2-3树的任何节点:
当节点只包含一个数据项时,可将其入smallItem,并用leftChildPtr和middleChildPtr来指向节点的孩子。为安全起见,可将NULL放入rightChildPtr。
下面分析2-3树的遍历、检索、插入和删除操作。这些操作都是使用递归算法。通过将这些递归算法的基例定义为叶子,而不是空子树,可以避免受到现实细节的干预。但这样,算法必须假设不能将空树作为参数传递给它们。
遍历2-3树
可通过类似于中序遍历的方式。按有序的查找关键字顺序遍历2-3树
查找2-3树
2-3树中的节点排序与二叉树中的排序相似,允许在2-3树中有效地查找某一项。实际上,有下面的伪码可以看到,2-3树的检索操作非常类似与二叉树的检索操作。
插入算法
要将项I插入2-3树,首先定位查找I的操作将终止的叶子。将新项I插入叶子,若当前叶子包含两个项目,则任务完成。但若叶子包含三个项,则必须将其分为两个节点n1和n2。如图4所示。将最小项S放在n1,将最大项放在n2,将中间项M上移到叶子的双亲。结果,节点n1和n2成为双亲的孩子。若双亲只有三个孩子,并包含两个项目,则任务完成。但是,若双亲当前有四个孩子,并包含有三项,则需要拆分。
图4:在2-3树中拆分叶子
通过上述叶子操作的过程,拆分包含三个项的内部节点n,但必须考虑n的四个孩子。如图5所示,将n拆分为n1和n2,将n的最小项S放到n1,将n左面的两个孩子关联到n1。将n的最大项L放入n2,将n右边的两个孩子关联到n2,将n的中间项M上移到n的双亲。
图5 :拆分2-3的内部节点
此后,拆分节点和将项上移到双亲的过程递归地进行,知道遇到这样一个节点:再插入前,它只有一个项,而在接纳新项后,只有两个项。注意,在前面的插入序列中,树的高度保持不变,一直是原始3 。一般情况下,只要在从根到插入新项的叶子的路径上,至少有一个节点只包含一个项,则插入将不会增加树的高度。因此,与基本二叉查找树的策略相比,2-3树的插入策略推迟了树的高度的增长。
当2-3树的高度增长时,则从项的顶部向下完成。如果从根到插入新项的叶子的路径上,每个节点包含两个项,则2-3树的高度将增长。在这种情况下,拆分节点以及将项上移到节点双亲的递归过程最终到达根r。此时,向其他任何内部节点一样,必须为r拆分为r1和r2。不过,必须新建一个包含r的中间项的节点,是这个节点成为n1和n2的双亲的节点。于是,新节点成为树的新项,如图6所示。
图6: 拆分2-3树的根
下面的算法总结整个插入策略:
删除算法
总之,要从2-3树删除I项,首先定位包含它的节点n。如果n不是叶子,则查找I的中序后继,并交换I与中序后继。在交换后,删除总是从叶子开始。如果叶子包含除I之外的项。则只需删除I即可完成任务。但是,如果叶子只包含I,则删除I将导致I不包含数据项的叶子。此时,必须执行其他的一些操作,才能完成删除。
首先检查空叶子的兄弟。若其一个兄弟有两个项,则在兄弟,空叶子和叶子双亲之间重新分配数据项,如图7所示。若叶子的兄弟没有两个项,则将一个项从叶子的双亲下移到兄弟(之前,他有一个项,所以有放置另一个项的空间),并删除空叶子,以归并叶子与邻接兄弟,如果7-b所示。
如上所述,通过从节点n下移一个项,可能导致节点n不在包含数据项,而且只有一个孩子,若出现这种情况,则为n递归应用删除算法。如果n的一个兄弟包含两个项和三个孩子,则在节点n、兄弟和双亲之间重新分配项。另外,将兄弟的一个孩子给n,如图7-c所示。
若n的兄弟都没有两个项,则归并n与兄弟,如图7-d所示。换言之,从双亲下移一个项,并使兄弟接纳n的一个孩子(之前的兄弟只有一个项和两个孩子),然后删除空叶子。若归并导致n的双亲没有项,则为其递归地应用删除过程。
若继续归并,将导致根没有项并只有一个孩子,此时简单的删除根。执行这个步骤是,树的高度减1,如图7-e。
图7:(a)重新分配值;(b)归并叶子;(c)重新分配值和叶子;(d)归并内部节点;(e)删除根
下面是从2-3树删除项的算法的高级语句:
分享到:
相关推荐
### B-树的实现与分析 B-树是一种自平衡的树数据结构,常用于数据库和文件系统中,因其能够高效地支持查找、插入和删除操作,并且在磁盘读写方面具有很好的性能。本文将从给定的代码片段出发,深入解析B-树的关键...
通过分析"2-3-tree-master.zip"的代码,我们可以深入理解2-3树的各种操作的实现细节,例如节点的创建、插入、删除和查找方法,以及树的平衡调整策略。这些实现可以帮助我们更好地应用和优化这种数据结构。
根据给定的信息,本文将详细解析B-树的实现与分析。B-树是一种非常重要的数据结构,在数据库索引、文件系统以及其他需要高效查找、插入和删除操作的应用场景中广泛使用。 ### B-树的基本概念 B-树是一种自平衡的多...
1. **M**: 定义为1,表示节点中键的最大数量为2*M = 2,因此这是一个2阶的B-树(即2-3树)。在实际应用中,M通常是一个较大的数值。 2. **结构体定义**: B-树的节点结构体`struct btnode`包括: - `int d`: 节点...
在本设计报告中提到的3路查找树,意味着每个节点最多可以有3个子节点。 - **B-Tree的特性**: - 所有叶节点的高度相同,这意味着B-Tree是平衡的。 - 除根节点外,每个节点至少包含M/2个键(M为树的阶数),这保证...
2-3树的效率分析: 由于2-3树的平衡性质,其高度始终保持O(log n),其中n是树中的元素数量。这意味着插入、删除和查找操作的时间复杂度都是O(log n),这是与二叉搜索树相比的一大优势,特别是当数据无序插入时。 在...
2. **词法分析**:项目中的源代码可能包含一个词法分析器,它将输入的字符流分解为有意义的标记,如关键字、标识符、操作符和常量。这个阶段是编译器的第一步,为语法分析提供基础输入。 3. **LR或LL解析**:语法...
2-线性回归代码实现 3-模型评估方法 3-线性回归实验分析 5-逻辑回归代码实现 6-逻辑回归实验分析 7-聚类算法-Kmeans&Dbscan原理 8-Kmeans代码实现 9-聚类算法实验分析 10-决策树原理 11-决策树代码实现 12-决策树...
B-树,全称为平衡多路搜索树(Balanced Multiway Search Tree),是数据库和文件系统中常用的一种数据结构,其设计目标是...通过阅读和分析源代码,可以更好地掌握B-树的内部操作,以及如何用C++高效地实现这些操作。
本次课程设计的目标是理解和实现B-树数据结构,这是一种高效的数据存储和检索方法,尤其适用于大量数据的管理和操作。学生将在Windows环境下使用Devc++开发软件进行编程,最低硬件要求为奔腾处理器和32MB内存,但...
决策树是一种广泛应用于数据分析和机器学习的监督学习方法,它通过构建树状模型来做出预测。在Python中,我们可以利用scikit-learn库轻松实现决策树的构建。本主题主要涵盖了以下几个方面: 1. **决策树的基本概念*...
Python机器学习基础算法教程:课件+数据+代码 一、课件PPT ...2-线性 回归代码实现 15-支持向量机原理推导 13-集成算法原理 1-线性回归原理推导 10-决策树原理 12-决策树实验分析 11-决策树代码实现
设计递归下降翻译器,完成语法分析和中间代码翻译。 输入:一个完整的源程序 输出:与输入对应的一个语法树、四元式序列 2、资源 课设报告word 课设源码 3、开发环境 编程语言:C++ IDE:VS 2019
通过这本书,读者不仅能学习到如何用C++解决实际问题,还能培养解决问题的思维能力和分析复杂度的能力,这对于面试和实际工作中面临的技术挑战都极其有价值。书中每个题目的解答都鼓励读者自己动手尝试,通过反复...
ns-3项目的主要文档有五种形式:ns-3 Doxygen(模拟器公共API文档)、教程、本手册以及最新版本和开发树的模型库、ns-3 Wiki。 手册的组织章节描述了ns-3软件的整体组织结构以及本手册相应的组织结构。ns-3源代码...
2. **构建语法树**:根据输入的标记流构建语法树,便于后续的分析与处理。 3. **错误检测与恢复**:检测语法错误并尝试进行错误恢复,以便继续后续的编译过程。 在语法分析阶段,通常会用到自顶向下解析(例如递归...
这是一种高效的Trie树实现方式,通过两个数组来存储节点信息,从而大幅度减少了存储空间的需求。双数组结构包括一个基本数组和一个检查数组,基本数组用来存储节点信息,检查数组用来提高空间利用率和访问速度。 ##...
通过该题目的设计过程,可以加深理解树及二叉树的逻辑结构、存储结构,掌握树及二叉树上基本运算的实现。进一步理解和熟练掌握课本中所学的各种数据结构,学会如何把学到的知识用于解决实际问题,培养学生的动手能力...