数据结构是以某种形式将数据组织在一起的集合,它不仅存储数据,还支持访问和处理数据的操作。算法是为求解一个问题需要遵循的、被清楚指定的简单指令的集合。下面是自己整理的常用数据结构与算法相关内容,如有错误,欢迎指出。
为了便于描述,文中涉及到的代码部分都是用Java语言编写的,其实Java本身对常见的几种数据结构,线性表、栈、队列等都提供了较好的实现,就是我们经常用到的Java集合框架,有需要的可以阅读这篇文章。Java - 集合框架完全解析
每种数据结构都会适用在不同的场合
需要先进先出,或者有指定优先采用的场景的数据用队列或优先队列
队列是用链表实现
当每次取节点中最大,或者最小值用堆
堆是用数组实现(最大树,最小树)
当需要排序用二叉树
二叉树---左、中、右排序
红黑树
有二叉树的排序也有颜色,二叉树结合颜色标志达到平衡,二叉树投影到水平数组都是有序的
二叉树解决了数组的高速遍历,链表的高速插入
避免二叉查找树可能成为链表(分布不均匀),引入平衡树-----无论哪种树有序的树水平投影都是一个有序的数组
一、线性表
线性表是最常用且最简单的一种数据结构,它是n个数据元素的有限序列。
实现线性表的方式一般有两种,一种是使用数组存储线性表的元素,即用一组连续的存储单元依次存储线性表的数据元素。另一种是使用链表存储线性表的元素,即用一组任意的存储单元存储线性表的数据元素(存储单元可以是连续的,也可以是不连续的)。
数组实现
数组是一种大小固定的数据结构,对线性表的所有操作都可以通过数组来实现。虽然数组一旦创建之后,它的大小就无法改变了,但是当数组不能再存储线性表中的新元素时,我们可以创建一个新的大的数组来替换当前数组。这样就可以使用数组实现动态的数据结构。
- 代码1 创建一个更大的数组来替换当前数组
- 代码2 在数组位置index上添加元素e
上面简单写出了数组实现线性表的两个典型函数,具体我们可以参考Java里面的ArrayList集合类的源码。数组实现的线性表优点在于可以通过下标来访问或者修改元素,比较高效,主要缺点在于插入和删除的花费开销较大,比如当在第一个位置前插入一个元素,那么首先要把所有的元素往后移动一个位置。为了提高在任意位置添加或者删除元素的效率,可以采用链式结构来实现线性表。
链表
链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。链表由一系列节点组成,这些节点不必在内存中相连。每个节点由数据部分Data和链部分Next,Next指向下一个节点,这样当添加或者删除时,只需要改变相关节点的Next的指向,效率很高。
下面主要用代码来展示链表的一些基本操作,需要注意的是,这里主要是以单链表为例,暂时不考虑双链表和循环链表。
- 代码3 链表的节点
- 代码4 定义好节点后,使用前一般是对头节点和尾节点进行初始化
- 代码5 空链表创建一个新节点
- 代码6 链表追加一个节点
- 代码7 顺序遍历链表
- 代码8 倒序遍历链表
- 代码 单链表反转
上面的几段代码主要展示了链表的几个基本操作,还有很多像获取指定元素,移除元素等操作大家可以自己完成,写这些代码的时候一定要理清节点之间关系,这样才不容易出错。
链表的实现还有其它的方式,常见的有循环单链表,双向链表,循环双向链表。 循环单链表 主要是链表的最后一个节点指向第一个节点,整体构成一个链环。 双向链表 主要是节点中包含两个指针部分,一个指向前驱元,一个指向后继元,JDK中LinkedList集合类的实现就是双向链表。** 循环双向链表** 是最后一个节点指向第一个节点。
二、栈与队列
栈和队列也是比较常见的数据结构,它们是比较特殊的线性表,因为对于栈来说,访问、插入和删除元素只能在栈顶进行,对于队列来说,元素只能从队列尾插入,从队列头访问和删除。
栈
栈是限制插入和删除只能在一个位置上进行的表,该位置是表的末端,叫作栈顶,对栈的基本操作有push(进栈)和pop(出栈),前者相当于插入,后者相当于删除最后一个元素。栈有时又叫作LIFO(Last In First Out)表,即后进先出。
下面我们看一道经典题目,加深对栈的理解。
上图中的答案是C,其中的原理可以好好想一想。
因为栈也是一个表,所以任何实现表的方法都能实现栈。我们打开JDK中的类Stack的源码,可以看到它就是继承类Vector的。当然,Stack是Java2前的容器类,现在我们可以使用LinkedList来进行栈的所有操作。
队列
队列是一种特殊的线性表,特殊之处在于它只允许在表的前端(front)进行删除操作,而在表的后端(rear)进行插入操作,和栈一样,队列是一种操作受限制的线性表。进行插入操作的端称为队尾,进行删除操作的端称为队头。
我们可以使用链表来实现队列,下面代码简单展示了利用LinkedList来实现队列类。
- 代码9 简单实现队列类
普通的队列是一种先进先出的数据结构,而优先队列中,元素都被赋予优先级。当访问元素的时候,具有最高优先级的元素最先被删除。优先队列在生活中的应用还是比较多的,比如医院的急症室为病人赋予优先级,具有最高优先级的病人最先得到治疗。在Java集合框架中,类PriorityQueue就是优先队列的实现类,具体大家可以去阅读源码。
三、树与二叉树
树型结构是一类非常重要的非线性数据结构,其中以树和二叉树最为常用。在介绍二叉树之前,我们先简单了解一下树的相关内容。
树
** 树 是由n(n>=1)个有限节点组成一个具有层次关系的集合。它具有以下特点:每个节点有零个或多个子节点;没有父节点的节点称为 根 节点;每一个非根节点有且只有一个 父节点 **;除了根节点外,每个子节点可以分为多个不相交的子树。
二叉树基本概念
- 定义
二叉树是每个节点最多有两棵子树的树结构。通常子树被称作“左子树”和“右子树”。二叉树常被用于实现二叉查找树和二叉堆。
- 相关性质
二叉树的每个结点至多只有2棵子树(不存在度大于2的结点),二叉树的子树有左右之分,次序不能颠倒。
二叉树的第i层至多有2(i-1)个结点;深度为k的二叉树至多有2k-1个结点。
一棵深度为k,且有2^k-1个节点的二叉树称之为** 满二叉树 **;
深度为k,有n个节点的二叉树,当且仅当其每一个节点都与深度为k的满二叉树中,序号为1至n的节点对应时,称之为** 完全二叉树 **。
- 三种遍历方法
在二叉树的一些应用中,常常要求在树中查找具有某种特征的节点,或者对树中全部节点进行某种处理,这就涉及到二叉树的遍历。二叉树主要是由3个基本单元组成,根节点、左子树和右子树。如果限定先左后右,那么根据这三个部分遍历的顺序不同,可以分为先序遍历、中序遍历和后续遍历三种。
(1) 先序遍历 若二叉树为空,则空操作,否则先访问根节点,再先序遍历左子树,最后先序遍历右子树。 (2) 中序遍历 若二叉树为空,则空操作,否则先中序遍历左子树,再访问根节点,最后中序遍历右子树。(3) 后序遍历 若二叉树为空,则空操作,否则先后序遍历左子树访问根节点,再后序遍历右子树,最后访问根节点。
- 树和二叉树的区别
(1) 二叉树每个节点最多有2个子节点,树则无限制。 (2) 二叉树中节点的子树分为左子树和右子树,即使某节点只有一棵子树,也要指明该子树是左子树还是右子树,即二叉树是有序的。 (3) 树决不能为空,它至少有一个节点,而一棵二叉树可以是空的。
上面我们主要对二叉树的相关概念进行了介绍,下面我们将从二叉查找树开始,介绍二叉树的几种常见类型,同时将之前的理论部分用代码实现出来。
二叉查找树
- 定义
二叉查找树就是二叉排序树,也叫二叉搜索树。二叉查找树或者是一棵空树,或者是具有下列性质的二叉树: (1) 若左子树不空,则左子树上所有结点的值均小于它的根结点的值;(2) 若右子树不空,则右子树上所有结点的值均大于它的根结点的值;(3) 左、右子树也分别为二叉排序树;(4) 没有键值相等的结点。
- 性能分析
对于二叉查找树来说,当给定值相同但顺序不同时,所构建的二叉查找树形态是不同的,下面看一个例子。
可以看到,含有n个节点的二叉查找树的平均查找长度和树的形态有关。最坏情况下,当先后插入的关键字有序时,构成的二叉查找树蜕变为单支树,树的深度为n,其平均查找长度(n+1)/2(和顺序查找相同),最好的情况是二叉查找树的形态和折半查找的判定树相同,其平均查找长度和log2(n)成正比。平均情况下,二叉查找树的平均查找长度和logn是等数量级的,所以为了获得更好的性能,通常在二叉查找树的构建过程需要进行“平衡化处理”,之后我们将介绍平衡二叉树和红黑树,这些均可以使查找树的高度为O(log(n))。
- 代码10 二叉树的节点
二叉查找树的三种遍历都可以直接用递归的方法来实现:
- 代码12 先序遍历
- 代码13 中序遍历
- 代码14 后序遍历
- 代码15 二叉查找树的简单实现
上面的代码15主要展示了一个自己实现的简单的二叉查找树,其中包括了几个常见的操作,当然更多的操作还是需要大家自己去完成。因为在二叉查找树中删除节点的操作比较复杂,所以下面我详细介绍一下这里。
- 二叉查找树中删除节点分析
要在二叉查找树中删除一个元素,首先需要定位包含该元素的节点,以及它的父节点。假设current指向二叉查找树中包含该元素的节点,而parent指向current节点的父节点,current节点可能是parent节点的左孩子,也可能是右孩子。这里需要考虑两种情况:
- current节点没有左孩子,那么只需要将patent节点和current节点的右孩子相连。
- current节点有一个左孩子,假设rightMost指向包含current节点的左子树中最大元素的节点,而parentOfRightMost指向rightMost节点的父节点。那么先使用rightMost节点中的元素值替换current节点中的元素值,将parentOfRightMost节点和rightMost节点的左孩子相连,然后删除rightMost节点。
平衡二叉树
平衡二叉树又称AVL树,它或者是一棵空树,或者是具有下列性质的二叉树:它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。
AVL树是最先发明的自平衡二叉查找树算法。在AVL中任何节点的两个儿子子树的高度最大差别为1,所以它也被称为高度平衡树,n个结点的AVL树最大深度约1.44log2n。查找、插入和删除在平均和最坏情况下都是O(log n)。增加和删除可能需要通过一次或多次树旋转来重新平衡这个树。
红黑树
红黑树是平衡二叉树的一种,它保证在最坏情况下基本动态集合操作的事件复杂度为O(log n)。红黑树和平衡二叉树区别如下:(1) 红黑树放弃了追求完全平衡,追求大致平衡,在与平衡二叉树的时间复杂度相差不大的情况下,保证每次插入最多只需要三次旋转就能达到平衡,实现起来也更为简单。(2) 平衡二叉树追求绝对平衡,条件比较苛刻,实现起来比较麻烦,每次插入新节点之后需要旋转的次数不能预知。点击查看更多
四、图
- 简介
图是一种较线性表和树更为复杂的数据结构,在线性表中,数据元素之间仅有线性关系,在树形结构中,数据元素之间有着明显的层次关系,而在图形结构中,节点之间的关系可以是任意的,图中任意两个数据元素之间都可能相关。图的应用相当广泛,特别是近年来的迅速发展,已经渗入到诸如语言学、逻辑学、物理、化学、电讯工程、计算机科学以及数学的其他分支中。
- 相关阅读
因为图这部分的内容还是比较多的,这里就不详细介绍了,有需要的可以自己搜索相关资料。
(1) 《百度百科对图的介绍》
(2) 《数据结构之图(存储结构、遍历)》
五、总结
到这里,关于常见的数据结构的整理就结束了,断断续续大概花了两天时间写完,在总结的过程中,通过查阅相关资料,结合书本内容,收获还是很大的,在下一篇博客中将会介绍常用数据结构与算法整理总结(下)之算法篇,欢迎大家关注。
相关推荐
在本总结中,我们将探讨几种重要的数据结构和相关的算法,主要包括:HASH表、栈、双端循环链表、顺序表、循环队列以及一些基本的排序方法。 **HASH表** 是一种通过哈希函数将键映射到数组特定位置的数据结构,以...
这份"数据结构与算法PPT与知识点整理"涵盖了这两个核心领域的关键概念,为初学者提供了深入学习的平台。 首先,我们要理解数据结构。数据结构是指组织、存储和管理数据的方式,以便于高效地访问和操作。常见的数据...
数据结构与算法是计算机科学的基础,对于理解和设计高效的软件至关重要。C++作为一种强大的、面向对象的编程语言,常被用于实现复杂的数据结构和算法。在《数据结构与算法——C++版(第3版)》中,作者深入浅出地介绍...
因此,他编写了配套的习题详解书籍,意在通过解答常见错误、提供多种解题思路和方法,帮助学生深化对数据结构概念和算法思想的理解,从而提高他们的算法设计与分析能力。 在数据结构的学习过程中,算法题无疑是难度...
数据结构与算法是计算机科学的基础,对于理解和解决复杂问题至关重要。小甲鱼数据结构与算法源码库提供了实践这些概念的实例,使学习者能够通过实际编程加深理解。在这个压缩包中,我们可以期待找到一系列用不同编程...
本资源“c#版数据结构和算法”正是针对这一需求而整理的,旨在帮助开发者深入理解数据结构和算法,并能在C#环境中熟练运用。 数据结构是存储和组织数据的方式,它提供了一种高效管理和访问数据的方法。常见的数据...
【排序算法】是计算机科学中一个重要的领域,它涉及到如何有效地组织和整理数据,以便于快速查找、访问和处理。本文将对几种常见的排序算法进行详细的解析,包括冒泡排序、交换排序、选择排序和插入排序,这些都是在...
【数据结构常用算法归纳】 在计算机科学中,数据结构和算法是解决问题的基础,其中排序算法是数据处理中不可或缺的一部分。本文主要探讨两种常见的排序算法:冒泡排序和插入排序。 **冒泡排序** 是一种简单直观的...
这份“2021年最新总结 500个常用数据结构,算法,算法导论,面试常用,大厂高级工程师整理总结.zip”压缩包文件显然是一个集大成之作,包含了C/C++/JAVA/Python四种主流编程语言的相关学习资源,旨在帮助学生和...
在这个压缩包中,"数据结构算法演示"可能包含了一系列的实例,用于直观地展示这些概念。数据结构是存储和组织数据的方式,而算法则是解决问题或执行任务的明确步骤。 1. **线性数据结构**:包括数组、链表、栈和...
数据结构基本算法整理 数据结构与算法是计算机科学中两个紧密相关的概念。数据结构是指计算机存储、组织和管理数据的方式,包括数组、链表、栈、队列、树、图等,而算法则是指解决问题的步骤或方法。数据结构和算法...
C++面试题笔试题C++ 数据结构算法笔试题资料合集: 50个C、C++面试题.pdf C++ 数据结构、算法笔试题.docx C++基础面试题.docx C++开发工程师面试题库.docx C++技能测试试卷一及答案.docx C++技能测试试卷二及答案....
本文档是关于数据结构与算法常用英语词汇的整理版,旨在帮助读者快速了解和记忆相关术语。文档分为多个部分,包括基本数据结构、字典、堆、树、图、排序算法、搜索算法、图算法、动态规划等。 基本数据结构 在...
"数据结构基本算法整理doc.zip"这个压缩包文件很可能包含了关于数据结构的各种经典算法的详细解释和实例,可能是以文档的形式,供学习者参考和实践。 1. **数组**:数组是最基础的数据结构,它是一系列相同类型元素...
数据结构与算法是计算机科学的基础,对于任何想要深入理解编程和优化程序性能的人来说,都是必不可少的知识。本资源包“数据结构与算法课件”为初学者提供了全面且深入的学习材料,帮助他们掌握这一领域的核心概念。...
这份"前端总结、手写代码、数据结构与算法 Leetcode、源码解析.zip"的压缩包文件,显然是一个精心整理的学习资源,旨在帮助开发者深入理解并熟练运用这些关键概念。以下是关于数据结构与算法的一些详细知识: 一、...
数据结构与算法是计算机科学的基础,对于理解和设计高效的软件系统至关重要。它们是计算机处理和组织信息的方式,以及解决复杂问题的工具。以下是一些常见的数据结构和算法问题及其解析: 1. **水仙花数问题**:...