排序算法的java实现可参考 https://github.com/shukuiyan/sort/blob/master/my
排序大的分类可以分为两种:内排序和外排序。在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序。下面讲的排序都是属于内排序。
内排序有可以分为以下几类:
(1)、插入排序:直接插入排序、二分法插入排序、希尔排序。
(2)、选择排序:简单选择排序、堆排序。
(3)、交换排序:冒泡排序、快速排序。
(4)、归并排序
(5)、基数排序
一、插入排序
•思想:每步将一个待排序的记录,按其顺序码大小插入到前面已经排序的字序列的合适位置,直到全部插入排序完为止。
•关键问题:在前面已经排好序的序列中找到合适的插入位置。
•方法:
–直接插入排序
–希尔排序
①直接插入排序(从后向前找到合适位置后插入)
1、基本思想:每步将一个待排序的记录,按其顺序码大小插入到前面已经排序的字序列的合适位置(从后向前找到合适位置后),直到全部插入排序完为止。
public static void commonInsertSort(int array[]) { if (array == null || array.length <= 0) { return; } for (int i = 1; i < array.length; i++) { int temp = array[i]; int j = i - 1; while (j >= 0 && temp < array[j])//开始查找当前temp元素对应前面已经排序好的队列中的位置 { array[j + 1] = array[j];//每个元素后移一位 j--; } array[j + 1] = temp; } /* 算法2 * for (int i = 0; i < data.length - 1; i++) { for (int j = i + 1; j >= 1; j--) { if (data[j] < data[j - 1]) { //如果后面的数字小于前面的数字,则两个数字位置交换 int temp = data[j]; data[j] = data[j - 1]; data[j - 1] = temp; } } }*/ }
直接插入排序是稳定的排序。关于各种算法的稳定性分析可以参考http://www.cnblogs.com/Braveliu/archive/2013/01/15/2861201.html
文件初态不同时,直接插入排序所耗费的时间有很大差异。若文件初态为正序,则每个待插入的记录只需要比较一次就能够找到合适的位置插入,故算法 的时间复杂度为O(n),这时最好的情况。若初态为反序,则第i个待插入记录需要比较i+1次才能找到合适位置插入,故时间复杂度为O(n2),这时最坏的情况。
直接插入排序的平均时间复杂度为O(n2)。
②希尔排序
基本思想:先取一个小于n的整数d1作为第一个增量,把文件的全部记录分成d1个组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序;然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量dt=1(dt<dt-l<…<d2<d1),即所有记录放在同一组中进行直接插入排序为止。该方法实质上是一种分组插入方法。
public static void shellSort(int[] array) { if (array == null || array.length <= 0) { return; } int d = array.length; while (d > 0) { shell(array, d); d /= 2; } } /** * 间隔是d的数组进行直接插入排序 * @param array * @param d */ public static void shell(int[] array, int d) { if (array == null || array.length <= 0 || d == 0 || d > array.length) { return; } for (int i = d; i < array.length; i += d) { int temp = array[i]; int j = i - d; while (j >= 0 && temp < array[j]) { array[j + d] = array[j]; j -= d; } array[j + d] = temp; } }
分析
我们知道一次插入排序是稳定的,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以希尔排序是不稳定的。
希尔排序的时间性能优于直接插入排序,原因如下:
(1)当文件初态基本有序时直接插入排序所需的比较和移动次数均较少。
(2)当n值较小时,n和n2的差别也较小,即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度0(n2)差别不大。
(3)在希尔排序开始时增量较大,分组较多,每组的记录数目少,故各组内直接插入较快,后来增量di逐渐缩小,分组数逐渐减少,而各组的记录数目逐渐增多,但由于已经按di-1作为距离排过序,使文件较接近于有序状态,所以新的一趟排序过程也较快。
因此,希尔排序在效率上较直接插人排序有较大的改进。
希尔排序的平均时间复杂度为O(nlogn)。
二、选择排序
/** * 选择排序 * 首先在未排序序列中找到最小元素,存放到排序序列的起始位置, * 然后,再从剩余未排序元素中继续寻找最小元素,然后放到排序序列末尾,以此类推,直到所有元素均排序完毕 * O(n*n) * @param array */ public static void selectSort(int array[]) { if (array == null || array.length <= 0) { return; } for (int i = 0; i < array.length; i++) { int min = i; for (int j = i + 1; j < array.length; j++) { if (array[j] < array[min]) { min = j; } } if (min != i) { int temp = array[i]; array[i] = array[min]; array[min] = temp; } } }
简单选择排序是不稳定的排序。
时间复杂度:T(n)=O(n2)。
②堆排序
1、基本思想:
堆排序是一种树形选择排序,是对直接选择排序的有效改进。
堆的定义下:具有n个元素的序列 (h1,h2,...,hn),当且仅当满足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最大项(大顶堆)。完全二 叉树可以很直观地表示堆的结构。堆顶为根,其它为左子树、右子树。
思想:初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储序,使之成为一个 堆,这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推,直到只有两个节点的堆,并对 它们作交换,最后得到有n个节点的有序序列。从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函 数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。
/** * 堆排序 * 排序过程中,第i次取堆顶记录重建大顶堆的时间复杂度为O(logi),并且需要取n-1次堆顶记录,所有重建堆的时间复杂度为O(nlogn)。总体上来说,堆排序的时间复杂度为:O(nlogn)。 * 因为初始化构建堆所需比较次数较多,所以堆排序不适合待排序元素较少的情况。 * 堆排序的平均时间复杂度为O(nlogn),空间复杂度为O(1) * @param array */ public static void headSort(int[] array) { for (int i = array.length / 2 - 1; i >= 0; i--) { heapAdjust(array, i, array.length - 1); }//建立大顶堆 时间复杂度为O(n) int temp = array[0]; array[0] = array[array.length - 1]; array[array.length - 1] = temp;//交换最大的元素至堆尾 for (int i = array.length - 2; i > 0; i--) { heapAdjust(array, 0, i); temp = array[0]; array[0] = array[i]; array[i] = temp; } } /** * 堆的一次调整 * array[s...m]中除了array[s]之外均满足堆的定义 * 本地调整array[s]元素,使待排数组array构成大顶堆 * array[i]的两个左右子树元素为array[2*i+1]和array[2*i+2] * @param array * @param s * @param m */ public static void heapAdjust(int[] array, int s, int m) { for (int i = 2 * s + 1; i <= m; i = i * 2 + 1) { int temp = array[s]; if (i < m && array[i] < array[i + 1])//取左右子树中值大的那个 { i++; } if (array[i] >= temp)////将当前父节点值与左右子树值大的那个节点值交换位置 { array[s] = array[i]; array[i] = temp; s = i;//下一个要调整的堆顶节点 } } }
堆排序也是一种不稳定的排序算法。
堆排序优于简单选择排序的原因:
直接选择排序中,为了从R[1..n]中选出关键字最小的记录,必须进行n-1次比较,然后在R[2..n]中选出关键字最小的记录,又需要做 n-2次比较。事实上,后面的n-2次比较中,有许多比较可能在前面的n-1次比较中已经做过,但由于前一趟排序时未保留这些比较结果,所以后一趟排序时 又重复执行了这些比较操作。
堆排序可通过树形结构保存部分比较结果,可减少比较次数。
堆排序的最坏时间复杂度为O(nlogn)。堆序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
三、交换排序
①冒泡排序
1、基本思想:在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。
/** * 冒泡排序思想:两两相邻元素之间的比较,如果前者大于后者,则交换; * 升序排序 * 稳定排序 * 复杂度为O(n^2) * @param array */ public static void bubble_sort(int array[]) { if (array == null || array.length <= 0) { return; } int size = array.length; for (int i = size - 1; i > 0; i--) { for (int j = 0; j < i; j++) { if (array[j] > array[j + 1]) { int temp = array[j]; array[j] = array[j + 1]; array[j + 1] = temp; } } System.out.print("第" + (size - i) + "次排序后:"); for (int k = 0; k < array.length; k++) { System.out.print(array[k] + ","); } System.out.println(); } } /** * 改进冒泡排序:通过一个boolean isChanged,如果一次循环中没有交换过元素,则说明已经排好序; * 升序排序 * 稳定排序 * @param array */ public static void bubble_sort2(int array[]) { if (array == null || array.length <= 0) { return; } int size = array.length; for (int i = size - 1; i > 0; i--) { boolean isChanged = false; for (int j = 0; j < i && isChanged; j++) { if (array[j] > array[j + 1]) { int temp = array[j]; array[j] = array[j + 1]; array[j + 1] = temp; isChanged = true; } } System.out.print("第" + (size - i) + "次排序后:"); for (int k = 0; k < array.length; k++) { System.out.print(array[k] + ","); } System.out.println(); } }
冒泡排序是一种稳定的排序方法。
/** * 快速排序 * 通过一趟排序将要排序的数据分割成独立的两部分,其中一部分所有数据都比另外一部分数据小。 * 然后按照此方法分别对两部分数据进行快速排序,整个过程可以使用递归进行,以达到排序目的 * @param array */ public static void quickSort(int[] array) { partition(array, 0, array.length - 1); } /** * 对数据从第start位置的元素到第end位置的元素进行一趟排序 * @param array * @param start * @param end */ public static void partition(int[] array, int start, int end) { if (array == null || array.length <= 0 || start < 0 || end > array.length - 1) { return; } int key = array[start]; int i = start; int j = end; while (i < j) { while (i < j && array[j] >= key)//从右侧开始寻找第一个小于key的值 { j--; } if (i < j) { array[i] = array[j]; } while (i < j && array[i] <= key)//从左侧开始需找第一个大于key的值 { i++; } if (i < j) { array[j] = array[i]; } } array[i] = key; if (i > start) { partition(array, start, i - 1); } if (i < end) { partition(array, i + 1, end); } }快速排序是不稳定的排序。
快速排序的时间复杂度为O(nlogn)。
当n较大时使用快排比较好,当序列基本有序时用快排反而不好。
四、归并排序
1、基本思想:归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。
/** * 归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列 * 归并算法是效率仅次于快排,并且稳定的排序 * @param array * @param start * @param end */ public static void mergeSort(int array[], int start, int end) { if (start >= end) { return; } int mid = (start + end) / 2; mergeSort(array, start, mid); mergeSort(array, mid + 1, end); merge(array, start, mid, end); } /** * array[start...mid]与array[mid+1...end]是两个都排序好的数组,该方法将两个部分排序好 * 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列 * 设定两个指针,最初位置分别为两个已经排序序列的起始位置 * 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置 * 重复步骤3直到某一指针达到序列尾 * 将另一序列剩下的所有元素直接复制到合并序列尾 * @param array * @param start * @param mid * @param end */ public static void merge(int array[], int start, int mid, int end) { if (start > mid || mid > end || start < 0 || end > array.length - 1) { return; } int temp[] = new int[end - start + 1]; int i = start; int j = mid + 1; int k = 0; while (i <= mid && j <= end) { if (array[i] <= array[j]) { temp[k++] = array[i++]; } else { temp[k++] = array[j++]; } } if (i <= mid) { for (int s = i; s <= mid; s++) { temp[k++] = array[s]; } } if (j <= end) { for (int s = j; s <= end; s++) { temp[k++] = array[s]; } } for (i = start, j = 0; i <= end; i++, j++) { array[i] = temp[j]; } }
归并排序是稳定的排序方法。
归并排序的时间复杂度为O(nlogn)。
速度仅次于快速排序,为稳定排序算法,一般用于对总体无序,但是各子项相对有序的数列。
一、稳定性:
稳定:冒泡排序、插入排序、归并排序和基数排序
不稳定:选择排序、快速排序、希尔排序、堆排序
二、平均时间复杂度
O(n^2):直接插入排序,简单选择排序,冒泡排序。
在数据规模较小时(9W内),直接插入排序,简单选择排序差不多。当数据较大时,冒泡排序算法的时间代价最高。性能为O(n^2)的算法基本上是相邻元素进行比较,基本上都是稳定的。
O(nlogn):快速排序,归并排序,希尔排序,堆排序。
其中,快排是最好的, 其次是归并和希尔,堆排序在数据量很大时效果明显。
三、排序算法的选择
1.数据规模较小
(1)待排序列基本序的情况下,可以选择直接插入排序;
(2)对稳定性不作要求宜用简单选择排序,对稳定性有要求宜用插入或冒泡
2.数据规模不是很大
(1)完全可以用内存空间,序列杂乱无序,对稳定性没有要求,快速排序,此时要付出log(N)的额外空间。
(2)序列本身可能有序,对稳定性有要求,空间允许下,宜用归并排序
3.数据规模很大
(1)对稳定性有求,则可考虑归并排序。
(2)对稳定性没要求,宜用堆排序
4.序列初始基本有序(正序),宜用直接插入,冒泡
参考 http://www.cnblogs.com/liuling/p/2013-7-24-01.html
相关推荐
基于改进YOLOv5s的森林烟火检测算法.pdf
人力资源管理工具绩效考核excel模板01
施工班组长绩效考核表
57 -营业部经理绩效考核表1
XX公司行政部绩效考核指标
1、文件内容:ant-apache-xalan2-1.9.4-2.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ant-apache-xalan2-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装
部门绩效考核表模板(基于KPI以月度为例2)
11-6-质检员绩效考核表(含自动计算、等级评价及任意设置等级)
2024最新全国河流湖泊矢量数据 【数据介绍】 2024年中国河流湖泊数据 一份包含中国境内所有主要河流和湖泊的地理信息数据。 数据格式:Shapefile:广泛使用的GIS数据格式,方便在各类GIS软件中使用。 数据获取:访问OpenStreetMap官网,通过导出工具选择中国区域并下载所需的数据。 使用Geofabrik等第三方网站,可以下载预处理好的中国区域的OSM数据。 数据使用:GIS软件:如QGIS、ArcGIS等,用户可以在这些软件中导入OSM数据进行可视化、分析和编辑。 数据应用: 环境研究:分析河流湖泊的水质变化,研究水资源分布及其环境影响。 城市规划:用于规划城市水系、洪水防控、水资源管理等。 导航和旅游:为河流湖泊的导航和旅游路线规划提供数据支持。 科研:为水文地理研究、生态保护、气候变化等领域提供基础数据。 数据特点: 实时更新:OSM数据由全球用户贡献,具有较高的实时性和更新频率。 开放性:所有数据都在开放许可下发布,允许用户自由使用、修改和分发。 详细性:由于全球志愿者的不断努力,数据细节较为丰富,涵盖了从主要河流湖泊到小型水体的广泛范围。 数据时间2024年5月,shp格式,数据来源OpenStreetMap。 OpenStreetMap(OSM)介绍: 一个开放的、免费的、全球性的地图项目,由全球的志愿者和地图爱好者们共同创建和维护。 OSM的数据包括道路、建筑、公园、河流、湖泊等各类地理信息。由于是由众多志愿者共同编辑,OSM的数据具有很高的实时性和详细程度,特别是在一些活跃的区域,地图数据的更新速度和精度往往超过商业地图服务。 用户可以直接在OSM官网下载地图数据,数据格式主要有OSM XML和PBF等。此外,还有一些第三方网站和工具提供更加便捷的数据下载和处理服务,如Geofabrik、Overpass API等。 OSM的数据可以在各种GIS软件中使用,如QGIS、ArcGIS等。此外,还可以使用Python的OSMnx、GeoPandas等库进行编程处理,或者通过Leaflet、Mapbox等JavaScript库将OSM数据集成到web地图应用中。 OSM的所有数据都在开放许可下发布,允许用户自由使用、修改和分发。这使得OSM成为了许多公共项目、研究机构和商业公司的重要数据来源。
部门绩效考核评分表
12-11-运输车队长绩效考核表(含自动计算、等级评价)
1、文件内容:ant-javadoc-1.9.4-2.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ant-javadoc-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装
springboot整合 freemarker方法
1、文件内容:apache-commons-codec-1.8-7.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/apache-commons-codec-1.8-7.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装
《旅游抽样调查资料》是反映入境游客在华(内地)花费和国内居民国内旅游情况的资料性年刊,分为上下两篇。 上篇为在华(内地)停留时间在3个月以内的入境游客抽样调查资料,由综合分析报告和调查分类数据两部分组成,分类数据包括:入境游客的主要特征,入境外国人、港澳台同胞的花费水平和花费构成、在境内的停留时间以及入境次数、流向和对住宿单位的选择等。 下篇为国内旅游抽样调查资料,汇集了对城镇居民和农村居民的国内旅游抽样调查结果,共分为四个部分:第一部分为综合分析报告;第二部分为国内旅游出游及花费情况;第三部分为城镇居民国内旅游抽样调查分类数据;第四部分为农村居民国内旅游抽样调查分类数据。
1、表单界面,身份证信息保存在dbf表中,供vfp应用使用,可导出为xls电子表格。 2、提供了身份证过期校验和查询功能。
人事行政主管绩效考核评分表
08 -大堂副理绩效考核表1
1、文件内容:apr-1.4.8-7.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/apr-1.4.8-7.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装
ComponentNameError解决办法.md