Participants:CPP,ZY ,LF,HZP
Date:08-09-20 7:20PM<o:p></o:p>
Recorder: LF,HZP<o:p></o:p>
本次讨论重点讨论了 快速排序,推排序,基数排序,计数排序算法和比较树模型;
依次介绍各种算法,为了使得记录的完整性,加入了没有讨论的一些简单算法,如果发现错误请及时通知免得贻笑大方
由于待排序的记录数量不同,使得排序过程中设计的存储器不同,可将排序算法分为两大类:一类是内部排序,一类是外部排序;
PS:讨论完了还有橘子吃,突然感觉就进入了共产主义社会!呵呵
直接插入排序<o:p></o:p>
算法描述:<o:p></o:p>
直接插入排序是一种简单的排序算法,它的基本操作是将一个记录插入到已排序的有序表中,从而得到一个新的、记录数加1 的有序表;
伪代码:
- Void InsertSort( int a[])
- {
- for int i= 1 to a.size
- int j = i -1;
- int temp = a[i];
- if temp< a[j]
- {
- for ( j; temp>a[j] and j>= 0;j--)
- {
- a[j+1] = a[j];
- }
- a [j+1] = temp;
- }
- }
效率分析:<o:p></o:p>
时间复杂度:首先最外层循环要执行 n-1次,因为要将待排序列依次插入有序表中;对于第n次插入,至少要比较一次,最多要比较n次,最少要移动元素0次,最多要移动元素n+2次,所以算法最好的时间复杂度为O(n)(即已经排序好的序列)最坏的时间复杂度为O(n^2),也就是元素刚好逆序的时候;平均时间复杂度约为n2/4;
空间复杂度:只需要一个元素的辅助空间,用于元素的位置交换O(1);
稳定性:稳定
结构复杂性和使用范围:此种排序算法适用于顺序存储结构,数组通过移动实现插入,链表这通过修改指针达到目的;适用于序列的元素不多的情况;
算法衍生:在直接插入排序中元素的移动频率和比较次数很高,有人提出用2 路插入排序算法改进;第一种:折半插入排序,利用了折半搜索算法的的思想,每次和已排好序列的中间元素比较大小这样来减少比较的次数;
希尔排序<o:p></o:p>
算法描述:<o:p></o:p>
基本思想是:先将整个待排元素序列分割成若干个子序列(由相隔某个“增量”的元素组成的)分别进行直接插入排序,然后依次缩减增量再进行排序,待整个序列中的元素基本有序(增量足够小)时,再对全体元素进行一次直接插入排序。因为直接插入排序在元素基本有序的情况下(接近最好情况),效率是很高的,因此希尔排序在时间效率上比前两种方法有较大提高。
增量序列一般都是经验数组,没有很证明最优的选法:{……9 5 3 2 1} {… 40 13 4 1}
伪代码:
- Void ShellSort ( int A[], int dlta[])
- {
- for int i = 0; i<dlat.size; i++
- ShellInsert ( int A[], int i);
- }
- Void ShellInsert ( int A[],int n)
- {
- for int i = 0 to i-1
- {
- for int j = i+n; j<A.size ; j+n;
- {
- int tmp = A[j];
- If tmp< A[i]
- {
- for ( int k = i; tmp<A[i]; k = k-n )
- A [k+n] = A[k];
- }
- A[k+n] = tmp;
- }
- }
- }
效率分析:<o:p></o:p>
Shell排序的执行时间依赖于增量序列。
好的增量序列的共同特征:
① 最后一个增量必须为1;(否则不能保证算法的正确性)
② 应该尽量避免序列中的值(尤其是相邻的值)互为倍数的情况。
有人通过大量的实验,给出了目前较好的结果:当n较大时,比较和移动的次数约在nl.25到1.6n1.25之间。
时间复杂度:O( n3/2 )<o:p></o:p>
希尔排序由于直接插入排序的原因:
n
当文件基本有序时直接插入排序算法需要的比较次数和移动次数较少;
n
当n较小时,n 与 n2的差别较小,即最好时间复杂度和最坏时间复杂度的差别不大;
n
当增量大时,分组数目多,但组内元素少,这样直接插入排序速度较快,当增量小时,由于数组已经基本有序,此时直接插入排序算法也有很好的效率;
空间复杂度:<o:p></o:p>
只需要一个零时变量空间;
稳定性:不稳定
冒泡排序<o:p></o:p>
算法描述:<o:p></o:p>
基本思想:在待排序列的无序区内,如果选择最大的一个元素将其“浮出水面”,对待排序列进行n-1 次冒泡,则序列完成排序过程;这种算法是进行相邻元素进行比较,然后将较大的元素往上挪动;
伪代码:
- Void bubbleSort( int A[])
- {
- for int i=0; i<A.size-1 ; i++
- {
- for int j = 1; j<A.size-i ; j++
- if A[j] < A[j-1]
- {
- int tmp = A[j];
- A[j]= A[j-1];
- A[j-1] = tmp;
- }
- }
- }
效率分析:<o:p></o:p>
时间复杂度:n次循环,第i次循环进行n-i次比较,比较次数不能减少,最少移动0次,当序列已经有序的时候,最多移动(3+6+9+……+3n)次;所以时间复杂都最好
最坏 平均复杂度都是一样的为O(n^2)
空间复杂度:只需要一个零时变量空间;O(1)
稳定性:稳定
算法衍生:<o:p></o:p>
如果对冒泡算法进行改进,可以设定一个标记为,标记这一趟排序是否进行了交换,若没有交换则整个算法结束;这种情况下,最好只要进行一次遍历,(已经有序)也就是O(n)的时间复杂度,空间复杂度为0;若待排序列为逆序,则达到最坏时间复杂度和空间复杂度。如上面分析;
快速排序(讨论重点)<o:p></o:p>
算法描述:<o:p></o:p>
基本思想:每一趟排序将待排记录分为两部分,其中一部分的关键字小于另一部分的所有关键字,然后分别对两部分进行排序;
伪代码:
- Void QuickSort ( int A[], int low, int high )
- {
- If (low < high)
- {
- pivotLoc = partition(A,low,high);
- QuickSort(A,low,pivotLoc-1);
- Quicksort(A,pivot+1,high);
- }
- }
- Int partition(int A[], int low, int high)
- {
- Pivotkey = A[low];
- While(low<high)
- {
- while(low<high and A[high] > =pivotkey ) { high--; }
- A[low] = A[high];
- While( low<high and A[low] <= pivotkey ) { low++ }
- A[high] = A[low]
- }
- A[low] = pivotkey;
- Return low;
- }
效率分析:<o:p></o:p>
快速排序的中心思想是分治法和递归
快速排序的时间主要耗费在划分操作上,对长度为k的区间进行划分,共需k-1次关键字的比较。
时间复杂度:最坏情况是每次划分选取的基准都是当前无序区中关键字最小(或最大)的记录,划分的结果是基准左边的子区间为空(或右边的子区间为空),而划分所得的另一个非空的子区间中记录数目,仅仅比划分前的无序区中记录个数减少一个。
因此,快速排序必须做n-1次划分,第i次划分开始时区间长度为n-i+1,所需的比较次数为n-i(1≤i≤n-1),故总的比较次数达到最大值:
Cmax = n(n-1)/2=O(n2)
如果按上面给出的划分算法,每次取当前无序区的第1个记录为基准,那么当文件的记录已按递增序(或递减序)排列时,每次划分所取的基准就是当前无序区中关键字最小(或最大)的记录,则快速排序所需的比较次数反而最多。此时退化为冒泡排序;
在最好情况下,每次划分所取的基准都是当前无序区的"中值"记录,划分的结果是基准的左、右两个无序子区间的长度大致相等。总的关键字比较次数:
0(nlgn)
空间复杂度:快速排序在系统内部需要一个栈来实现递归。若每次划分较为均匀,则其递归树的高度为O(lgn),故递归后需栈空间为O(lgn)。最坏情况下,递归树的高度为O(n),所需的栈空间为O(n)。
稳定性:不稳定
算法衍生:<o:p></o:p>
算法改进:<o:p></o:p>
A.
改进中枢元素的选取方法:
a)
平均法:采用low high 和中间元素的平均值作为中枢值
b)
中间元素法:采用low high,和中间元素之中 元素值处于中间的值为中枢值
c)
随即法:随机选取序列中的一个元素值作为中枢值;
B.
与其他排序算法想结合:由于在待排序列元素数目较少的情况下,直接插入排序有其很好的优势,所以可以将直接插入算法与快速排序想结合,即当待排序列数目小于特定值时就采用直接插入算法。当然也可以考虑其他简单算法结合;
比较树:(为什么O(nlgn) 是比较排序算法的最好时间复杂度)
这个我描述不清楚,这个大家参考 算法导论2nd 165页
我想说的时通过比较树模可以证明任意一个比较排序算法在最坏情况下,都需要做O(nlgn)次比较,也就是说这个比较排序算法的最好时间复杂度的下届;
尝试论述比较树模型:对于任意可比较序列,这个序列不同的排序可能性总共是n!
,而比较树就是一个包含了所有可能的树模型!(树形状就不画了!)对于任何一种排序的可能性,都有一条路径表达这种关系!
形状考虑一颗高度为h,具有m个可达叶节点的决策树,它对应于对n个元素所做的比较排序。因为n个输入元素共有n!种排列,每一一种都作为一个叶子节点出现在树中,故有n!<= L 。又由于一颗高为h的二叉树中,叶子的数目不多于2h ,则有
n!<= L<= 2h ,
取对数,得到 h>=
lg(n!) = O(nlgn) #
快速排序的思想应用:线性时间内选择第k大的元素<o:p></o:p>
伪代码:
- Int RandomSelect (A,p,r,i )
- { if p== r
- Return;
- q = RandomPartition(A,p,r);
- k = q-p+1;
- if k==i
- then return A[i];
- else i<k
- return RandomSelect(A,p,q-1,i);
- else
- return RandomSelect( A,q+1,r,i-k);
- }
简单注释:和快速排序一样,RandomPartition(A,p,r)
是对待排序列进行划分,返回值为中枢元素的位置(q),中枢位置前的元素都小于中枢值,中枢位置后的元素都大于中枢值,换句话说,q位置的元素就是第q大的元素。这样如果k恰好等于q,则返回,如果q<k;则说明第k大的元素在q元素后面的第k-q个位置上,如果q>k,则在第k大元素在前面的第k个位置。
现在需要证明的是这个过程是线性时间的:证明见算法导论p111;
简单选择排序<o:p></o:p>
算法描述:<o:p></o:p>
每一趟从待排序的记录中选出关键字最小的记录,顺序放在已排好序的子文件的最后,直到全部记录排序完毕。
伪代码:
Void SelectSort( int A[] )
{ for int i= 0 to A.size
j = SelectMin(A,i+1); // 选择i后面最小的元素
A[i]
与 A[j] 交换
}
效率分析:<o:p></o:p>
时间复杂度:无论文件初始状态如何,在第i趟排序中选出最小关键字的记录,需做n-i次比较,因此,总的比较次数也是O(n2)
待排序列如果是已经排好序的,则移动次数为0.,如果是逆序的,则每次都需要交换,也就是移动次数为3(n-1)<o:p></o:p>
空间复杂度:如果需要交换则为O(1),否则为0
稳定性:不稳定
结构复杂性和使用范围:直接选择排序的用处不大,他的用处主要是用于引出树形排序和堆排序
堆排序<o:p></o:p>
算法描述:n个关键字序列Kl,
分享到:
相关推荐
Hoare在1960年提出,是一种高效的排序算法,其基本思想是通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,然后分别对这两部分记录继续进行排序,以达到整个序列有序。...
本文主要讨论了四种常见的排序算法,它们是插入排序、交换排序(冒泡排序)、选择排序和快速排序,这些都是C++编程中经常遇到的数据结构和算法知识点。 首先,选择排序是一种简单直观的排序方法。它的工作原理是每...
本文将详细解释如何使用C++实现冒泡排序、快速排序、插入排序、基数排序、希尔排序、归并排序和选择排序这七种常见的排序算法,并且讨论它们的特点和适用场景。 ### 冒泡排序 冒泡排序是最简单直观的排序算法之一。...
在实验报告中,应详细记录每种排序方法的运行过程,包括时间复杂度分析和空间复杂度分析。此外,还应该讨论在不同场景下如何根据数据特性选择合适的排序算法。 总的来说,这个实验提供了实践经验,加深了对排序算法...
在讨论中,我们通常假设记录以数组形式存储,并使用直接插入排序作为例子。 直接插入排序是一种简单的内部排序算法,它的思想是将当前记录依次与已排序的部分进行比较,找到合适的位置将其插入,直到所有记录都被...
直接插入排序的过程为:在插入第 i 个记录时,R1,R2,..Ri-1 已经排好序,将第 i 个记录的排序码 Ki 依次和 R1,R2,..,Ri-1 的排序码逐个进行比较,找到适当的位置。直接插入排序的时间复杂度为 O(n*n)。 堆排序的...
如果待排序的记录已经按照关键码排序,我们称之为正序;反之,如果顺序相反,则为反序。排序算法的稳定性是指在排序过程中,相等关键码的记录相对位置是否保持不变。稳定的排序算法会保留相等关键码记录的原始顺序,...
在讨论排序算法时,经常提到性能参数,主要关注的是时间复杂度、空间复杂度和排序稳定性。时间复杂度是衡量算法运行时间的长短,空间复杂度是算法执行过程中占用的存储空间大小。排序稳定性指的是对于含有相同关键字...
排序就是将一组无序的记录,通过关键字之间的比较和记录的移动,最终将之排列成一个按关键字大小排列的有序序列。排序的作用是为了更加方便我们使用查询的算法来查找到我们想要的数据,进而可以对相应的数据进行操作...
首先,我们要讨论的是排序算法的运行时间。在描述中提到,由于某些排序算法的执行速度非常快,使用`clock()`函数可能会因为时间精度问题导致记录的结果为0。为了更精确地测量这些快速算法的运行时间,通常我们会采用...
本文将详细讨论一个基于C语言实现的数据结构排序程序,涵盖了多种排序算法,包括希尔排序、选择排序、插入排序以及冒泡排序。这些排序算法在实际应用中有着广泛的应用,并且通过比较它们的执行时间和效果,可以更好...
下面我们将详细讨论选择法排序的原理和C语言实现的关键步骤: 1. **排序原理**: - 首先,从待排序的序列中找出最小(或最大)的元素。 - 将该元素与序列的第一个元素交换位置。 - 接着,对剩下的未排序元素重复...
基数排序的算法思路是从最低位关键码起,按关键码的不同值将序列中的记录“分配”到 RADIX 个队列中,然后再“收集”之。如此重复 d 次即可。 7. 基数排序的实现过程 基数排序的实现过程可以分为两个步骤:分配...
选取一个基准元素,通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,然后分别对这两部分记录继续进行排序,以达到整个序列有序。在C++中,可以递归地调用函数,每次选择...
本文将详细讨论并比较三种常见的排序方法:交换排序法、插入排序法和选择排序法。 **交换排序法**,其中最典型的就是冒泡排序和快速排序。冒泡排序通过不断交换相邻的错误顺序元素来实现排序,其核心思想是每次遍历...
4. 快速排序:通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,然后分别对这两部分记录继续进行排序,以达到整个序列有序。平均时间复杂度为O(n log n),最坏情况下为O(n...
3. **性能测试**:对于每种排序算法,记录其排序所需的时间,并保存排序后的数组至文件。 4. **性能对比**:比较不同排序算法的性能,包括平均运行时间、最好情况和最坏情况下的时间复杂度。 #### 六、实验报告撰写...
下面我们将深入分析几种常见的内部排序算法:冒泡排序、选择排序、快速排序、插入排序以及希尔排序,并着重讨论它们在比较次数和移动次数上的表现。 ### 冒泡排序 冒泡排序是一种简单的排序算法,它重复地遍历待...
在计算机科学中,排序算法是数据处理的核心技术之一,它能极大地提高数据处理的效率。本章主要讨论了排序的基本概念、分类以及一些常见的排序算法。 排序的基本概念围绕着如何根据关键字对数据记录进行有序排列。...