`
shukuiyan
  • 浏览: 414773 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

排序算法整理

阅读更多

       排序算法的java实现可参考 https://github.com/shukuiyan/sort/blob/master/my

 

       排序大的分类可以分为两种:内排序和外排序。在排序过程中,全部记录存放在内存,则称为内排序,如果排序过程中需要使用外存,则称为外排序。下面讲的排序都是属于内排序。

  内排序有可以分为以下几类:

 

  (1)、插入排序:直接插入排序、二分法插入排序、希尔排序。

 

  (2)、选择排序:简单选择排序、堆排序。

 

  (3)、交换排序:冒泡排序、快速排序。

 

  (4)、归并排序

 

  (5)、基数排序

 

一、插入排序

 •思想:每步将一个待排序的记录,按其顺序码大小插入到前面已经排序的字序列的合适位置,直到全部插入排序完为止。

 •关键问题:在前面已经排好序的序列中找到合适的插入位置。

 •方法:

 –直接插入排序

 –希尔排序

 ①直接插入排序(从后向前找到合适位置后插入)

   1、基本思想:每步将一个待排序的记录,按其顺序码大小插入到前面已经排序的字序列的合适位置(从后向前找到合适位置后),直到全部插入排序完为止。

 

public static void commonInsertSort(int array[])
	{
		if (array == null || array.length <= 0)
		{
			return;
		}
		for (int i = 1; i < array.length; i++)
		{
			int temp = array[i];
			int j = i - 1;
			while (j >= 0 && temp < array[j])//开始查找当前temp元素对应前面已经排序好的队列中的位置
			{
				array[j + 1] = array[j];//每个元素后移一位
				j--;
			}
			array[j + 1] = temp;
		}

		/* 算法2
		 * for (int i = 0; i < data.length - 1; i++)
		{
			for (int j = i + 1; j >= 1; j--)
			{
				if (data[j] < data[j - 1])
				{
					//如果后面的数字小于前面的数字,则两个数字位置交换

					int temp = data[j];
					data[j] = data[j - 1];
					data[j - 1] = temp;
				}
			}
		}*/

	}

 

  直接插入排序是稳定的排序。关于各种算法的稳定性分析可以参考http://www.cnblogs.com/Braveliu/archive/2013/01/15/2861201.html

   文件初态不同时,直接插入排序所耗费的时间有很大差异。若文件初态为正序,则每个待插入的记录只需要比较一次就能够找到合适的位置插入,故算法 的时间复杂度为O(n),这时最好的情况。若初态为反序,则第i个待插入记录需要比较i+1次才能找到合适位置插入,故时间复杂度为O(n2),这时最坏的情况。

   直接插入排序的平均时间复杂度为O(n2)。

 希尔排序

  基本思想:先取一个小于n的整数d1作为第一个增量,把文件的全部记录分成d1个组。所有距离为d1的倍数的记录放在同一个组中。先在各组内进行直接插入排序;然后,取第二个增量d2<d1重复上述的分组和排序,直至所取的增量dt=1(dt<dt-l<…<d2<d1),即所有记录放在同一组中进行直接插入排序为止。该方法实质上是一种分组插入方法。

   

public static void shellSort(int[] array)
	{
		if (array == null || array.length <= 0)
		{
			return;
		}
		int d = array.length;
		while (d > 0)
		{
			shell(array, d);
			d /= 2;
		}
	}

	/**
	 * 间隔是d的数组进行直接插入排序
	 * @param array
	 * @param d
	 */
	public static void shell(int[] array, int d)
	{
		if (array == null || array.length <= 0 || d == 0 || d > array.length)
		{
			return;
		}

		for (int i = d; i < array.length; i += d)
		{
			int temp = array[i];
			int j = i - d;
			while (j >= 0 && temp < array[j])
			{
				array[j + d] = array[j];
				j -= d;
			}
			array[j + d] = temp;
		}
	}

 

       分析

  我们知道一次插入排序是稳定的,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以希尔排序是不稳定的。

   希尔排序的时间性能优于直接插入排序,原因如下:

   (1)当文件初态基本有序时直接插入排序所需的比较和移动次数均较少。

   (2)当n值较小时,n和n2的差别也较小,即直接插入排序的最好时间复杂度O(n)和最坏时间复杂度0(n2)差别不大。

   (3)在希尔排序开始时增量较大,分组较多,每组的记录数目少,故各组内直接插入较快,后来增量di逐渐缩小,分组数逐渐减少,而各组的记录数目逐渐增多,但由于已经按di-1作为距离排过序,使文件较接近于有序状态,所以新的一趟排序过程也较快。

   因此,希尔排序在效率上较直接插人排序有较大的改进。

   希尔排序的平均时间复杂度为O(nlogn)。

 二、选择排序

•思想:每趟从待排序的记录序列中选择关键字最小的记录放置到已排序表的最前位置,直到全部排完。
•关键问题:在剩余的待排序记录序列中找到最小关键码记录。
•方法:
–直接选择排序
–堆排序
 ①简单的选择排序
  基本思想:在要排序的一组数中,选出最小的一个数与第一个位置的数交换;然后在剩下的数当中再找最小的与第二个位置的数交换,如此循环到倒数第二个数和最后一个数比较为止。
/**
	 * 选择排序
	 * 首先在未排序序列中找到最小元素,存放到排序序列的起始位置,
	 * 然后,再从剩余未排序元素中继续寻找最小元素,然后放到排序序列末尾,以此类推,直到所有元素均排序完毕
	 * O(n*n)
	 * @param array
	 */
	public static void selectSort(int array[])
	{
		if (array == null || array.length <= 0)
		{
			return;
		}

		for (int i = 0; i < array.length; i++)
		{
			int min = i;
			for (int j = i + 1; j < array.length; j++)
			{
				if (array[j] < array[min])
				{
					min = j;
				}
			}
			if (min != i)
			{
				int temp = array[i];
				array[i] = array[min];
				array[min] = temp;
			}
		}
	}

    简单选择排序是不稳定的排序。

  时间复杂度:T(n)=O(n2)。

 ②堆排序

  1、基本思想:

  堆排序是一种树形选择排序,是对直接选择排序的有效改进。

  堆的定义下:具有n个元素的序列 (h1,h2,...,hn),当且仅当满足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,...,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最大项(大顶堆)。完全二 叉树可以很直观地表示堆的结构。堆顶为根,其它为左子树、右子树。

  思想:初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储序,使之成为一个 堆,这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推,直到只有两个节点的堆,并对 它们作交换,最后得到有n个节点的有序序列。从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函 数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。

/**
	 * 堆排序
	 * 排序过程中,第i次取堆顶记录重建大顶堆的时间复杂度为O(logi),并且需要取n-1次堆顶记录,所有重建堆的时间复杂度为O(nlogn)。总体上来说,堆排序的时间复杂度为:O(nlogn)。
	 * 因为初始化构建堆所需比较次数较多,所以堆排序不适合待排序元素较少的情况。
	 * 堆排序的平均时间复杂度为O(nlogn),空间复杂度为O(1)
	 * @param array
	 */
	public static void headSort(int[] array)
	{
		for (int i = array.length / 2 - 1; i >= 0; i--)
		{
			heapAdjust(array, i, array.length - 1);
		}//建立大顶堆  时间复杂度为O(n)

		int temp = array[0];
		array[0] = array[array.length - 1];
		array[array.length - 1] = temp;//交换最大的元素至堆尾

		for (int i = array.length - 2; i > 0; i--)
		{
			heapAdjust(array, 0, i);

			temp = array[0];
			array[0] = array[i];
			array[i] = temp;
		}

	}

	/**
	 * 堆的一次调整
	 * array[s...m]中除了array[s]之外均满足堆的定义
	 * 本地调整array[s]元素,使待排数组array构成大顶堆
	 * array[i]的两个左右子树元素为array[2*i+1]和array[2*i+2]
	 * @param array
	 * @param s
	 * @param m
	 */
	public static void heapAdjust(int[] array, int s, int m)
	{
		for (int i = 2 * s + 1; i <= m; i = i * 2 + 1)
		{
			int temp = array[s];
			if (i < m && array[i] < array[i + 1])//取左右子树中值大的那个
			{
				i++;
			}
			if (array[i] >= temp)////将当前父节点值与左右子树值大的那个节点值交换位置
			{
				array[s] = array[i];
				array[i] = temp;
				s = i;//下一个要调整的堆顶节点
			}
		}
	}

 堆排序也是一种不稳定的排序算法。

  堆排序优于简单选择排序的原因:

  直接选择排序中,为了从R[1..n]中选出关键字最小的记录,必须进行n-1次比较,然后在R[2..n]中选出关键字最小的记录,又需要做 n-2次比较。事实上,后面的n-2次比较中,有许多比较可能在前面的n-1次比较中已经做过,但由于前一趟排序时未保留这些比较结果,所以后一趟排序时 又重复执行了这些比较操作。

  堆排序可通过树形结构保存部分比较结果,可减少比较次数。

  堆排序的最坏时间复杂度O(nlogn)。堆序的平均性能较接近于最坏性能。由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。

 

三、交换排序

①冒泡排序

  1、基本思想:在要排序的一组数中,对当前还未排好序的范围内的全部数,自上而下对相邻的两个数依次进行比较和调整,让较大的数往下沉,较小的往上冒。即:每当两相邻的数比较后发现它们的排序与排序要求相反时,就将它们互换。

/**
	 * 冒泡排序思想:两两相邻元素之间的比较,如果前者大于后者,则交换;
	 * 升序排序
	 * 稳定排序
	 * 复杂度为O(n^2)
	 * @param array
	 */
	public static void bubble_sort(int array[])
	{
		if (array == null || array.length <= 0)
		{
			return;
		}
		int size = array.length;
		for (int i = size - 1; i > 0; i--)
		{
			for (int j = 0; j < i; j++)
			{
				if (array[j] > array[j + 1])
				{
					int temp = array[j];
					array[j] = array[j + 1];
					array[j + 1] = temp;
				}
			}
			System.out.print("第" + (size - i) + "次排序后:");
			for (int k = 0; k < array.length; k++)
			{
				System.out.print(array[k] + ",");
			}
			System.out.println();
		}
	}

	/**
	 * 改进冒泡排序:通过一个boolean isChanged,如果一次循环中没有交换过元素,则说明已经排好序;
	 * 升序排序
	 * 稳定排序
	 * @param array
	 */
	public static void bubble_sort2(int array[])
	{
		if (array == null || array.length <= 0)
		{
			return;
		}
		int size = array.length;
		for (int i = size - 1; i > 0; i--)
		{
			boolean isChanged = false;
			for (int j = 0; j < i && isChanged; j++)
			{
				if (array[j] > array[j + 1])
				{
					int temp = array[j];
					array[j] = array[j + 1];
					array[j + 1] = temp;
					isChanged = true;
				}
			}
			System.out.print("第" + (size - i) + "次排序后:");
			for (int k = 0; k < array.length; k++)
			{
				System.out.print(array[k] + ",");
			}
			System.out.println();
		}
	}

 

冒泡排序是一种稳定的排序方法。 

•若文件初状为正序,则一趟起泡就可完成排序,排序码的比较次数为n-1,且没有记录移动,时间复杂度是O(n)
•若文件初态为逆序,则需要n-1趟起泡,每趟进行n-i次排序码的比较,且每次比较都移动三次,比较和移动次数均达到最大值∶O(n2)
•起泡排序平均时间复杂度为O(n2)
②快速排序
  1、基本思想:选择一个基准元素,通常选择第一个元素或者最后一个元素,通过一趟扫描,将待排序列分成两部分,一部分比基准元素小,一部分大于等于基准元素,此时基准元素在其排好序后的正确位置,然后再用同样的方法递归地排序划分的两部分。
/**
	 * 快速排序
	 * 通过一趟排序将要排序的数据分割成独立的两部分,其中一部分所有数据都比另外一部分数据小。
	 * 然后按照此方法分别对两部分数据进行快速排序,整个过程可以使用递归进行,以达到排序目的
	 * @param array
	 */
	public static void quickSort(int[] array)
	{
		partition(array, 0, array.length - 1);
	}

	/**
	 * 对数据从第start位置的元素到第end位置的元素进行一趟排序
	 * @param array
	 * @param start
	 * @param end
	 */
	public static void partition(int[] array, int start, int end)
	{
		if (array == null || array.length <= 0 || start < 0 || end > array.length - 1)
		{
			return;
		}
		int key = array[start];
		int i = start;
		int j = end;
		while (i < j)
		{
			while (i < j && array[j] >= key)//从右侧开始寻找第一个小于key的值
			{
				j--;
			}
			if (i < j)
			{
				array[i] = array[j];
			}
			while (i < j && array[i] <= key)//从左侧开始需找第一个大于key的值
			{
				i++;
			}
			if (i < j)
			{
				array[j] = array[i];
			}
		}
		array[i] = key;
		if (i > start)
		{
			partition(array, start, i - 1);
		}
		if (i < end)
		{
			partition(array, i + 1, end);
		}
	}
       快速排序是不稳定的排序。

  快速排序的时间复杂度为O(nlogn)。

  当n较大时使用快排比较好,当序列基本有序时用快排反而不好。

 四、归并排序

  1、基本思想:归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列。

/**
	 * 归并(Merge)排序法是将两个(或两个以上)有序表合并成一个新的有序表,即把待排序序列分为若干个子序列,每个子序列是有序的。然后再把有序子序列合并为整体有序序列
	 * 归并算法是效率仅次于快排,并且稳定的排序
	 * @param array
	 * @param start
	 * @param end
	 */
	public static void mergeSort(int array[], int start, int end)
	{
		if (start >= end)
		{
			return;
		}
		int mid = (start + end) / 2;
		mergeSort(array, start, mid);
		mergeSort(array, mid + 1, end);
		merge(array, start, mid, end);
	}

	/**
	 * array[start...mid]与array[mid+1...end]是两个都排序好的数组,该方法将两个部分排序好
	 * 申请空间,使其大小为两个已经排序序列之和,该空间用来存放合并后的序列
	 * 设定两个指针,最初位置分别为两个已经排序序列的起始位置
	 * 比较两个指针所指向的元素,选择相对小的元素放入到合并空间,并移动指针到下一位置
	 * 重复步骤3直到某一指针达到序列尾
	 * 将另一序列剩下的所有元素直接复制到合并序列尾
	 * @param array
	 * @param start
	 * @param mid
	 * @param end
	 */
	public static void merge(int array[], int start, int mid, int end)
	{
		if (start > mid || mid > end || start < 0 || end > array.length - 1)
		{
			return;
		}
		int temp[] = new int[end - start + 1];
		int i = start;
		int j = mid + 1;
		int k = 0;
		while (i <= mid && j <= end)
		{
			if (array[i] <= array[j])
			{
				temp[k++] = array[i++];
			}
			else
			{
				temp[k++] = array[j++];
			}
		}
		if (i <= mid)
		{
			for (int s = i; s <= mid; s++)
			{
				temp[k++] = array[s];
			}
		}
		if (j <= end)
		{
			for (int s = j; s <= end; s++)
			{
				temp[k++] = array[s];
			}
		}
		for (i = start, j = 0; i <= end; i++, j++)
		{
			array[i] = temp[j];
		}
	}

    归并排序是稳定的排序方法。

  归并排序的时间复杂度为O(nlogn)。

  速度仅次于快速排序,为稳定排序算法,一般用于对总体无序,但是各子项相对有序的数列。

 总结:

一、稳定性:

    稳定:冒泡排序、插入排序、归并排序和基数排序

  不稳定:选择排序、快速排序、希尔排序、堆排序

二、平均时间复杂度

  O(n^2):直接插入排序,简单选择排序,冒泡排序。

  在数据规模较小时(9W内),直接插入排序,简单选择排序差不多。当数据较大时,冒泡排序算法的时间代价最高。性能为O(n^2)的算法基本上是相邻元素进行比较,基本上都是稳定的

  O(nlogn):快速排序,归并排序,希尔排序,堆排序。

  其中,快排是最好的, 其次是归并和希尔,堆排序在数据量很大时效果明显。

三、排序算法的选择

  1.数据规模较小

    (1)待排序列基本序的情况下,可以选择直接插入排序

    (2)对稳定性不作要求宜用简单选择排序,对稳定性有要求宜用插入或冒泡

  2.数据规模不是很大

  (1)完全可以用内存空间,序列杂乱无序,对稳定性没有要求,快速排序,此时要付出log(N)的额外空间。

  (2)序列本身可能有序,对稳定性有要求,空间允许下,宜用归并排序

  3.数据规模很大

     (1)对稳定性有求,则可考虑归并排序

      (2)对稳定性没要求,宜用堆排序

  4.序列初始基本有序(正序),宜用直接插入,冒泡

 

 

 

 

参考 http://www.cnblogs.com/liuling/p/2013-7-24-01.html

 

分享到:
评论

相关推荐

    基于改进YOLOv5s的森林烟火检测算法.pdf

    基于改进YOLOv5s的森林烟火检测算法.pdf

    人力资源管理工具绩效考核excel模板01.xlsx

    人力资源管理工具绩效考核excel模板01

    施工班组长绩效考核表.xls

    施工班组长绩效考核表

    57 -营业部经理绩效考核表1.xlsx

    57 -营业部经理绩效考核表1

    XX公司行政部绩效考核指标.xls

    XX公司行政部绩效考核指标

    ant-apache-xalan2-1.9.4-2.el7.x64-86.rpm.tar.gz

    1、文件内容:ant-apache-xalan2-1.9.4-2.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ant-apache-xalan2-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装

    部门绩效考核表模板(基于KPI以月度为例2).xlsx

    部门绩效考核表模板(基于KPI以月度为例2)

    11-6-质检员绩效考核表(含自动计算、等级评价及任意设置等级).xlsx

    11-6-质检员绩效考核表(含自动计算、等级评价及任意设置等级)

    2024年最新全国河流、湖泊矢量数据(数据权威)

    2024最新全国河流湖泊矢量数据 【数据介绍】 2024年中国河流湖泊数据 一份包含中国境内所有主要河流和湖泊的地理信息数据。 数据格式:Shapefile:广泛使用的GIS数据格式,方便在各类GIS软件中使用。 数据获取:访问OpenStreetMap官网,通过导出工具选择中国区域并下载所需的数据。 使用Geofabrik等第三方网站,可以下载预处理好的中国区域的OSM数据。 数据使用:GIS软件:如QGIS、ArcGIS等,用户可以在这些软件中导入OSM数据进行可视化、分析和编辑。 数据应用: 环境研究:分析河流湖泊的水质变化,研究水资源分布及其环境影响。 城市规划:用于规划城市水系、洪水防控、水资源管理等。 导航和旅游:为河流湖泊的导航和旅游路线规划提供数据支持。 科研:为水文地理研究、生态保护、气候变化等领域提供基础数据。 数据特点: 实时更新:OSM数据由全球用户贡献,具有较高的实时性和更新频率。 开放性:所有数据都在开放许可下发布,允许用户自由使用、修改和分发。 详细性:由于全球志愿者的不断努力,数据细节较为丰富,涵盖了从主要河流湖泊到小型水体的广泛范围。 数据时间2024年5月,shp格式,数据来源OpenStreetMap。 OpenStreetMap(OSM)介绍: 一个开放的、免费的、全球性的地图项目,由全球的志愿者和地图爱好者们共同创建和维护。 OSM的数据包括道路、建筑、公园、河流、湖泊等各类地理信息。由于是由众多志愿者共同编辑,OSM的数据具有很高的实时性和详细程度,特别是在一些活跃的区域,地图数据的更新速度和精度往往超过商业地图服务。 用户可以直接在OSM官网下载地图数据,数据格式主要有OSM XML和PBF等。此外,还有一些第三方网站和工具提供更加便捷的数据下载和处理服务,如Geofabrik、Overpass API等。 OSM的数据可以在各种GIS软件中使用,如QGIS、ArcGIS等。此外,还可以使用Python的OSMnx、GeoPandas等库进行编程处理,或者通过Leaflet、Mapbox等JavaScript库将OSM数据集成到web地图应用中。 OSM的所有数据都在开放许可下发布,允许用户自由使用、修改和分发。这使得OSM成为了许多公共项目、研究机构和商业公司的重要数据来源。

    部门绩效考核评分表.xlsx

    部门绩效考核评分表

    12-11-运输车队长绩效考核表(含自动计算、等级评价).xlsx

    12-11-运输车队长绩效考核表(含自动计算、等级评价)

    ant-javadoc-1.9.4-2.el7.x64-86.rpm.tar.gz

    1、文件内容:ant-javadoc-1.9.4-2.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ant-javadoc-1.9.4-2.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装

    springboot整合 freemarker方法

    springboot整合 freemarker方法

    apache-commons-codec-1.8-7.el7.x64-86.rpm.tar.gz

    1、文件内容:apache-commons-codec-1.8-7.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/apache-commons-codec-1.8-7.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装

    (数据权威)全国旅游抽样调查数据

    《旅游抽样调查资料》是反映入境游客在华(内地)花费和国内居民国内旅游情况的资料性年刊,分为上下两篇。 上篇为在华(内地)停留时间在3个月以内的入境游客抽样调查资料,由综合分析报告和调查分类数据两部分组成,分类数据包括:入境游客的主要特征,入境外国人、港澳台同胞的花费水平和花费构成、在境内的停留时间以及入境次数、流向和对住宿单位的选择等。 下篇为国内旅游抽样调查资料,汇集了对城镇居民和农村居民的国内旅游抽样调查结果,共分为四个部分:第一部分为综合分析报告;第二部分为国内旅游出游及花费情况;第三部分为城镇居民国内旅游抽样调查分类数据;第四部分为农村居民国内旅游抽样调查分类数据。

    二代身份证信息读取(vfp8.0)

    1、表单界面,身份证信息保存在dbf表中,供vfp应用使用,可导出为xls电子表格。 2、提供了身份证过期校验和查询功能。

    人事行政主管绩效考核评分表.xls

    人事行政主管绩效考核评分表

    08 -大堂副理绩效考核表1.xlsx

    08 -大堂副理绩效考核表1

    apr-1.4.8-7.el7.x64-86.rpm.tar.gz

    1、文件内容:apr-1.4.8-7.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/apr-1.4.8-7.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、安装指导:私信博主,全程指导安装

    ComponentNameError解决办法.md

    ComponentNameError解决办法.md

Global site tag (gtag.js) - Google Analytics