`
这些年
  • 浏览: 399857 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

相亲相爱的B家人(B树,B+树,B-树,B*树)(转)

 
阅读更多

今天突然想起曾今一个学长说的一句话,他说数据结构中B+树在计算机中用的最多,曾几何时我们也好像学过B树,可是酱油过来已经忘得差不多了,B+树做为了我们的自学部分,自学的当然在那时就认为是不用学的了。

         早上的实验课无聊,就现场百度了一把,想看看B+树的知识,一下把我吓了一跳 ,原来B树有这么多的兄弟,不仅仅是B+,还有B-树,当然还有B*树,暂时没看到B/树,点开了那篇文档,文档不长,但是对每种树的介绍都挺清楚的,即使不深入,知道有那么一回事 还是好的,和别人扯淡底气也足一些啊,又扯淡了。。。。于是乎我花了几个百度的财富值把那篇文档档下来了,贴出来,大家一起了解了解,看看B树的大家族。

         B

    即二叉搜索树:

 

          1.所有非叶子结点至多拥有两个儿子(LeftRight);

 

          2.所有结点存储一个关键字;

 

          3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;

              如:

 

B树的搜索,从根结点开始,如果查询的关键字与结点的关键字相等,那么就命中;否则,如果查询关键字比结点关键字小,就进入左儿子;如果比结点关键字大,就进入右儿子;如果左儿子或右儿子的指针为空,则报告找不到相应的关键字;

     如果B树的所有非叶子结点的左右子树的结点数目均保持差不多(平衡),那么B树的搜索性能逼近二分查找;但它比连续内存空间的二分查找的优点是,改变B树结构(插入与删除结点)不需要移动大段的内存数据,甚至通常是常数开销;

     如:

   

  

 

 B树在经过多次插入与删除后,有可能导致不同的结构:

 

 
右边也是一个B树,但它的搜索性能已经是线性的了;同样的关键字集合有可能导致不同的树结构索引;所以,使用B树还要考虑尽可能让B树保持左图的结构,和避免右图的结构,也就是所谓的平衡问题;      

 

       实际使用的B树都是在原B树的基础上加上平衡算法,即平衡二叉树;如何保持B树结点分布均匀的平衡算法是平衡二叉树的关键;平衡算法是一种在B树中插入和删除结点的策略;

 

<!--[if !supportLineBreakNewLine]-->
<!--[endif]-->

 

 

  B-

 是一种多路搜索树(并不是二叉的):

       1.定义任意非叶子结点最多只有M个儿子;且M>2

       2.根结点的儿子数为[2, M]

       3.除根结点以外的非叶子结点的儿子数为[M/2, M]

       4.每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字)

       5.非叶子结点的关键字个数=指向儿子的指针个数-1

       6.非叶子结点的关键字:K[1], K[2], …, K[M-1];且K[i] < K[i+1]

 

       7.非叶子结点的指针:P[1], P[2], …, P[M];其中P[1]指向关键字小于K[1]的子树,P[M]指向  关键字大于K[M-1]的子树,其它P[i]指向关键字属于(K[i-1], K[i])的子树;

   8.所有叶子结点位于同一层;

    如:(M=3

   

 

  B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结  束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是  叶子结点;

 

B-树的特性:

 

       1.关键字集合分布在整颗树中;

 

       2.任何一个关键字出现且只出现在一个结点中;

 

       3.搜索有可能在非叶子结点结束;

 

       4.其搜索性能等价于在关键字全集内做一次二分查找;

 

       5.自动层次控制;

 

       由于限制了除根结点以外的非叶子结点,至少含有M/2个儿子,确保了结点的至少利用率,其最底搜索性能为:

 

    

 
其中,M为设定的非叶子结点最多子树个数,N为关键字总数;

 

       所以B-树的性能总是等价于二分查找(与M值无关),也就没有B树平衡的问题;

 

       由于M/2的限制,在插入结点时,如果结点已满,需要将结点分裂为两个各占M/2的结点;  删除结点时,需将两个不足M/2的兄弟结点合并;

 

    B+

 

     B+树是B-树的变体,也是一种多路搜索树:

 

       1.其定义基本与B-树同,除了:

 

       2.非叶子结点的子树指针与关键字个数相同;

 

       3.非叶子结点的子树指针P[i],指向关键字值属于[K[i], K[i+1])的子树(B-树是开区间);

 

       5.为所有叶子结点增加一个链指针;

 

       6.所有关键字都在叶子结点出现;

 

       如:(M=3

   

  
B+的搜索与B-树也基本相同,区别是B+树只有达到叶子结点才命中(B-树可以在非叶子结点   命中),其性能也等价于在关键字全集做一次二分查找;

 

       B+的特性:

 

       1.所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;

 

       2.不可能在非叶子结点命中;

 

       3.非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数    据的数据层;

       4.更适合文件索引系统;

     B*树

        B+树的变体,在B+树的非根和非叶子结点再增加指向兄弟的指针;

    


 
 
 
B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3(代替B+树的1/2);

       B+树的分裂:当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针;

       B*树的分裂:当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针;

       所以,B*树分配新结点的概率比B+树要低,空间使用率更高;

 

小结

       B树:二叉树,每个结点只存储一个关键字,等于则命中,小于走左结点,大于走右结点;

       B-树:多路搜索树,每个结点存储M/2M个关键字,非叶子结点存储指向关键字范围的子    结点;

       所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;

       B+树:在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶    子结点作为叶子结点的索引;B+树总是到叶子结点才命中;

       B*树:在B+树基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高                到2/3

 

   性能相当,都等价于在关键字全集做一次二分查找;

    B-
树 改善了B树的平衡问题, 
    B+
树比 B-树 
更适合文件索引系统(结构上的改善)
    B*
树比B+树改善了空间利用率。

  

PS:

 原文出处:http://blog.chinaunix.net/u2/86638/showart_2018357.html

现在这个网址也点不开了,很早的博客了!!!向原作者致敬!!!

分享到:
评论

相关推荐

    相亲-相亲网站-相亲网站源码-相亲网站java代码-基于springboot的相亲网站-相亲项目-相亲项目代码-相亲代码-代码

    相亲-相亲网站-相亲网站源码-相亲网站java代码-相亲网站设计与实现-基于springboot的相亲网站-基于Web的相亲网站设计与实现-相亲项目-相亲项目代码相亲系统-相亲系统源码-相亲管理系统-相亲管理系统java代码-相亲...

    相亲-相亲网站-相亲网站源码-相亲网站java代码-基于Web的相亲网站设计与实现-相亲网站设计与实现-相亲项目代码-java

    相亲-相亲网站-相亲网站源码-相亲网站java代码-相亲网站设计与实现-基于springboot的相亲网站-基于Web的相亲网站设计与实现-相亲项目-相亲项目代码相亲系统-相亲系统源码-相亲管理系统-相亲管理系统java代码-相亲...

    人教版初中政治目录.docx

    1. **第一单元:相亲相爱一家人** - **第一课:爱在屋檐下** - 家庭关系的理解,感恩家庭,培养孝顺父母的美德。 - **第二课:我与父母交朋友** - 如何与父母有效沟通,处理代沟问题。 2. **第二单元:师友结伴...

    相亲进行曲---PMP生活大赛参赛作品.ppt

    - **项目启动大会**:美美宣布她要相亲,邀请家人朋友组成后援团,明确了项目目标——找到合适的伴侣。 - **项目章程**:确定相亲的目的和标准,如寻找白马王子,展示真实的自我。 - **项目启动会**:分析个人优缺点...

    部编版一年级道德与法治下册第三单元《10家人的爱》教案(共2课时).docx

    - 播放歌曲《相亲相爱一家人》,让学生分享自己家庭的故事。 - **活动二:游戏互动,引发思考** - 通过“我当鸡妈妈鸡爸爸”的游戏,体验父母保护孩子的心情。 - 讨论父母为孩子做的事情,感受父母的付出。 - *...

    大学生自信心团体辅导训练方案.docx

    4. **相亲相爱一家人** - 共唱《相亲相爱》歌曲,用手语表达情感,增强团队凝聚力。 **第二阶段:认识自我** 1. **可怜的小猫** - 游戏方式让成员放松并展示自己的幽默感,增进自我认知。 2. **循环沟通** - 面对面...

    有关个人述职报告模板七篇_1.docx

    - 社联强调“相亲相爱一家人的宗旨”,成员之间不分等级,以兄弟姐妹相称。 - 组织内有较强的团队合作精神,成员们共同面对各种挑战。 - **工作内容**: - 定期举行例会。 - 办公室内部也会召开专门会议。 - **...

    typora使用说明简介

    - **Ctrl + b**: 加粗文字。 - **Ctrl + i**: 斜体文字。 - **Ctrl + u**: 添加下划线。 - **Ctrl + =**: 提升标题级别。 - **Ctrl + -**: 降低标题级别。 - **Ctrl + h**: 选中文字后进行替换操作。 - **Ctrl + k**...

    软考高项知识点速记口诀汇总

    - **新七种**:“锯树相亲策动优” - “亲和图、过程决策程序图、关联图、树形图、优先矩阵、活动网络图、矩阵图” **5. 项目目标的特点** - **口诀**:“目标是鲜橙多” - “项目目标的特点:优先级、层次性、...

    XX医院XX科室2022年春节联欢晚会活动方案(工会活动、支部活动).docx

    - 抽奖环节,最后合唱《我们是相亲相爱的一家人》。 #### 四、活动时间和地点 - **时间**:2022年1月21日,上午8:30至晚上22:30。 - **地点**: - 养老院 - 公园 - 预定餐厅 - KTV #### 五、参加活动人数 -...

    Java毕业设计-基于Springboot+Vue相亲网站设计-源码+数据库+PPT+报告+任务书+使用文档+演示视频 高分项目

    Java毕业设计-基于Springboot+Vue相亲网站设计-源码+数据库+PPT+报告+任务书+使用文档+演示视频(高分项目) 该项目是个人高分毕业设计项目源码,已获导师指导认可通过,答辩评审分达到97分,在window10/11测试环境...

    相亲方案.pdf

    文件内容“相亲方案.pdf”和内容片段“***()***:1a.b.c.***%***-***-***,3,,,***,,”看起来像是一个扫描的PDF文件中的随机字符和数字,并没有实际的信息可以用来提取或者解释IT相关的知识点。如果您可以提供具有实际...

    javaweb项目相亲网站.zip

    【JavaWeb项目相亲网站】是一个基于JavaWeb技术开发的现代婚恋交友平台,旨在为当代年轻人提供便捷的恋爱相亲服务。这个项目具有完整的功能模块,不仅适用于个人学习和提升JavaWeb开发技能,也是毕业设计的理想选择...

    八年级政治相亲相爱一家人学会与父母沟通一教学目标鲁教版.doc

    【知识点详解】 1. **逆反心理**:逆反心理是指青少年在成长过程中,面对权威或者父母的管教,常常表现出的一种与预期相反的行为反应。表现为孩子常常喜欢与父母对着干,不愿意接受父母的观点,即使父母的意见是...

    婚恋大数据分析与应用研究.pptx

    - **相亲记录**:记录相亲时间、地点、对象信息等,用于分析择偶倾向和成功率。 - **咨询反馈**:收集会员在婚恋过程中遇到的问题和反馈,以优化婚介服务。 - **社交网络数据**: - **用户画像**:通过社交媒体...

    开题报告宠物相亲网站 已通过开题答辩的.docx

    B/S 架构因其灵活性和可扩展性成为许多项目的首选,尤其是在面向广大用户的应用场景下。 #### 二、课题研究的主要内容 - **技术栈的选择**:本项目采用 Spring Boot 框架进行开发,这是一种流行的轻量级微服务框架...

Global site tag (gtag.js) - Google Analytics