- 浏览: 79572 次
- 性别:
- 来自: 南京
最新评论
-
amy929:
你好!我最近在做学mapreduce,可否发一份这个代码给我学 ...
MapReduce框架中矩阵相乘的算法思路及其实现 -
微笑春天:
楼主 你好 花了一晚上的时间看了下你这个算法的实现 说实话 我 ...
MapReduce框架中矩阵相乘的算法思路及其实现 -
gaycolour:
大大,同求完整代码!634677370@qq.com
MapReduce框架中矩阵相乘的算法思路及其实现 -
zarchary-10:
你好,同求完整代码,可否发份zzy07053437@163.c ...
MapReduce框架中矩阵相乘的算法思路及其实现 -
developerinit:
你好,最近也在研究mapreduce矩阵乘法,想看下你这个例子 ...
MapReduce框架中矩阵相乘的算法思路及其实现
各种排序算法的稳定性和时间复杂度小结
冒泡法:
这是最原始,也是众所周知的最慢的算法了。他的名字的由来因为它的工作看来象是冒泡: 复杂度为O(n*n)。当数据为正序,将不会有交换。复杂度为O(0)。
直接插入排序: O(n*n)
选择排序: O(n*n)
快速排序:平均时间复杂度log2(n)*n,所有内部排序方法中最高好的,大多数情况下总是最好的。
归并排序: log2(n)*n
堆排序: log2(n)*n
希尔排序:算法的复杂度为n的1.2次幂
这里我没有给出行为的分析,因为这个很简单,我们直接来分析算法:
首先我们考虑最理想的情况
1.数组的大小是2的幂,这样分下去始终可以被2整除。假设为2的k次方,即k=log2(n)。
2.每次我们选择的值刚好是中间值,这样,数组才可以被等分。
第一层递归,循环n次,第二层循环2*(n/2)......
所以共有n+2(n/2)+4(n/4)+...+n*(n/n) = n+n+n+...+n=k*n=log2(n)*n
所以算法复杂度为O(log2(n)*n)
其他的情况只会比这种情况差,最差的情况是每次选择到的middle都是最小值或最大值,那么他将变成交换法(由于使用了递归,情况更糟)。但是你认为这种情况发生的几率有多大??呵呵,你完全不必担心这个问题。实践证明,大多数的情况,快速排序总是最好的。
如果你担心这个问题,你可以使用堆排序,这是一种稳定的O(log2(n)*n)算法,但是通常情况下速度要慢 于快速排序(因为要重组堆)。
这几天笔试了好几次了,连续碰到一个关于常见排序算法稳定性判别的问题,往往还是多选,对于我以及和我一样拿不准的同学可不是一个能轻易下结论的题目,当然如果你笔试之前已经记住了数据结构书上哪些是稳定的,哪些不是稳定的,做起来应该可以轻松搞定。
本文是针对老是记不住这个或者想真正明白到底为什么是稳定或者不稳定的人准备的。
首先,排序算法的稳定性大家应该都知道,通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下,如果Ai = Aj, Ai原来在位置前,排序后Ai还是要在Aj位置前。
其次,说一下稳定性的好处。排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就 是这样,先按低位排序,逐次按高位排序,低位相同的元素其顺序再高位也相同时是不会改变的。另外,如果排序算法稳定,对基于比较的排序算法而言,元素交换 的次数可能会少一些(个人感觉,没有证实)。
回到主题,现在分析一下常见的排序算法的稳定性,每个都给出简单的理由。
(1)冒泡排序
冒泡排序就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,我想你是不会再无 聊地把他们俩交换一下的;如果两个相等的元素没有相邻,那么即使通过前面的两两交换把两个相邻起来,这时候也不会交换,所以相同元素的前后顺序并没有改 变,所以冒泡排序是一种稳定排序算法。
(2)选择排序
选择排序是给每个位置选择当前元素最小的,比如给第一个位置选择最小的,在剩余元素里面给第二个元素选择第二小的,依次类推,直到第n-1个元素,第n个 元素不用选择了,因为只剩下它一个最大的元素了。那么,在一趟选择,如果当前元素比一个元素小,而该小的元素又出现在一个和当前元素相等的元素后面,那么 交换后稳定性就被破坏了。比较拗口,举个例子,序列5 8 5 2 9, 我们知道第一遍选择第1个元素5会和2交换,那么原序列中2个5的相对前后顺序就被破坏了,所以选择排序不是一个稳定的排序算法。
(3)插入排序
插入排序是在一个已经有序的小序列的基础上,一次插入一个元素。当然,刚开始这个有序的小序列只有1个元素,就是第一个元素。比较是从有序序列的末尾开
始,也就是想要插入的元素和已经有序的最大者开始比起,如果比它大则直接插入在其后面,否则一直往前找直到找到它该插入的位置。如果碰见一个和插入元素相
等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后顺序没有改变,从原无序序列出去的顺序就是排好序后的顺序,所以插入排序是稳
定的。
(4)快速排序
快速排序有两个方向,左边的i下标一直往右走,当a[i] <=
a[center_index],其中center_index是中枢元素的数组下标,一般取为数组第0个元素。而右边的j下标一直往左走,当a[j]
> a[center_index]。如果i和j都走不动了,i <= j, 交换a[i]和a[j],重复上面的过程,直到i>j。
交换a[j]和a[center_index],完成一趟快速排序。在中枢元素和a[j]交换的时候,很有可能把前面的元素的稳定性打乱,比如序列为 5
3 3 4 3 8 9 10 11,
现在中枢元素5和3(第5个元素,下标从1开始计)交换就会把元素3的稳定性打乱,所以快速排序是一个不稳定的排序算法,不稳定发生在中枢元素和a[j]
交换的时刻。
(5)归并排序
归并排序是把序列递归地分成短序列,递归出口是短序列只有1个元素(认为直接有序)或者2个序列(1次比较和交换),然后把各个有序的段序列合并成一个有
序的长序列,不断合并直到原序列全部排好序。可以发现,在1个或2个元素时,1个元素不会交换,2个元素如果大小相等也没有人故意交换,这不会破坏稳定
性。那么,在短的有序序列合并的过程中,稳定是是否受到破坏?没有,合并过程中我们可以保证如果两个当前元素相等时,我们把处在前面的序列的元素保存在结
果序列的前面,这样就保证了稳定性。所以,归并排序也是稳定的排序算法。
(6)基数排序
基数排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次类推,直到最高位。有时候有些属性是有优先级顺序的,先按低优先级排序,再按高优
先级排序,最后的次序就是高优先级高的在前,高优先级相同的低优先级高的在前。基数排序基于分别排序,分别收集,所以其是稳定的排序算法。
(7)希尔排序(shell)
希尔排序是按照不同步长对元素进行插入排序,当刚开始元素很无序的时候,步长最大,所以插入排序的元素个数很少,速度很快;当元素基本有序了,步长很小,
插入排序对于有序的序列效率很高。所以,希尔排序的时间复杂度会比o(n^2)好一些。由于多次插入排序,我们知道一次插入排序是稳定的,不会改变相同元
素的相对顺序,但在不同的插入排序过程中,相同的元素可能在各自的插入排序中移动,最后其稳定性就会被打乱,所以shell排序是不稳定的。
(8)堆排序
我们知道堆的结构是节点i的孩子为2*i和2*i+1节点,大顶堆要求父节点大于等于其2个子节点,小顶堆要求父节点小于等于其2个子节点。在一个长为n
的序列,堆排序的过程是从第n/2开始和其子节点共3个值选择最大(大顶堆)或者最小(小顶堆),这3个元素之间的选择当然不会破坏稳定性。但当为n
/2-1, n/2-2,
...1这些个父节点选择元素时,就会破坏稳定性。有可能第n/2个父节点交换把后面一个元素交换过去了,而第n/2-1个父节点把后面一个相同的元素没
有交换,那么这2个相同的元素之间的稳定性就被破坏了。所以,堆排序不是稳定的排序算法
1 快速排序(QuickSort)
快速排序是一个就地排序,分而治之,大规模递归的算法。从本质上来说,它是归并排序的就地版本。快速排序可以由下面四步组成。
(1) 如果不多于1个数据,直接返回。
(2) 一般选择序列最左边的值作为支点数据。
(3) 将序列分成2部分,一部分都大于支点数据,另外一部分都小于支点数据。
(4) 对两边利用递归排序数列。
快速排序比大部分排序算法都要快。尽管我们可以在某些特殊的情况下写出比快速排序快的算法,但是就通常情况而言,没有比它更快的了。快速排序是递归的,对于内存非常有限的机器来说,它不是一个好的选择。
2 归并排序(MergeSort)
归并排序先分解要排序的序列,从1分成2,2分成4,依次分解,当分解到只有1个一组的时候,就可以排序这些分组,然后依次合并回原来的序列中,这样就可以排序所有数据。合并排序比堆排序稍微快一点,但是需要比堆排序多一倍的内存空间,因为它需要一个额外的数组。
3 堆排序(HeapSort)
堆排序适合于数据量非常大的场合(百万数据)。
堆排序不需要大量的递归或者多维的暂存数组。这对于数据量非常巨大的序列是合适的。比如超过数百万条记录,因为快速排序,归并排序都使用递归来设计算法,在数据量非常大的时候,可能会发生堆栈溢出错误。
堆排序会将所有的数据建成一个堆,最大的数据在堆顶,然后将堆顶数据和序列的最后一个数据交换。接下来再次重建堆,交换数据,依次下去,就可以排序所有的数据。
4 Shell排序(ShellSort)
Shell排序通过将数据分成不同的组,先对每一组进行排序,然后再对所有的元素进行一次插入排序,以减少数据交换和移动的次数。平均效率是O(nlogn)。其中分组的合理性会对算法产生重要的影响。现在多用D.E.Knuth的分组方法。
Shell排序比冒泡排序快5倍,比插入排序大致快2倍。Shell排序比起QuickSort,MergeSort,HeapSort慢很多。但是它相对比较简单,它适合于数据量在5000以下并且速度并不是特别重要的场合。它对于数据量较小的数列重复排序是非常好的。
5 插入排序(InsertSort)
插入排序通过把序列中的值插入一个已经排序好的序列中,直到该序列的结束。插入排序是对冒泡排序的改进。它比冒泡排序快2倍。一般不用在数据大于1000的场合下使用插入排序,或者重复排序超过200数据项的序列。
6 冒泡排序(BubbleSort)
冒泡排序是最慢的排序算法。在实际运用中它是效率最低的算法。它通过一趟又一趟地比较数组中的每一个元素,使较大的数据下沉,较小的数据上升。它是O(n^2)的算法。
7 交换排序(ExchangeSort)和选择排序(SelectSort)
这两种排序方法都是交换方法的排序算法,效率都是 O(n2
)。在实际应用中处于和冒泡排序基本相同的地位。它们只是排序算法发展的初级阶段,在实际中使用较少。
8 基数排序(RadixSort)
基
数排序和通常的排序算法并不走同样的路线。它是一种比较新颖的算法,但是它只能用于整数的排序,如果我们要把同样的办法运用到浮点数上,我们必须了解浮点
数的存储格式,并通过特殊的方式将浮点数映射到整数上,然后再映射回去,这是非常麻烦的事情,因此,它的使用同样也不多。而且,最重要的是,这样算法也需
要较多的存储空间。
9 总结
下面是一个总的表格,大致总结了我们常见的所有的排序算法的特点。
排序法 | 平均时间 | 最差情形 | 稳定度 | 额外空间 | 备注 |
冒泡 | O(n2 ) | O(n2 ) | 稳定 | O(1) | n小时较好 |
交换 | O(n2 ) | O(n2 ) | 不稳定 | O(1) | n小时较好 |
选择 | O(n2 ) | O(n2 ) | 不稳定 | O(1) | n小时较好 |
插入 | O(n2 ) | O(n2 ) | 稳定 | O(1) | 大部分已排序时较好 |
基数 | O(logR B) | O(logR B) | 稳定 | O(n) |
B是真数(0-9), R是基数(个十百) |
Shell | O(nlogn) | O(ns ) 1<s<2 | 不稳定 | O(1) | s是所选分组 |
快速 | O(nlogn) | O(n2 ) | 不稳定 | O(nlogn) | n大时较好 |
归并 | O(nlogn) | O(nlogn) | 稳定 | O(1) | n大时较好 |
堆 | O(nlogn) | O(nlogn) | 不稳定 | O(1) | n大时较好 |
以下是一个基于模板的通用排序:
这个程序我想就没有分析的必要了,大家看一下就可以了。不明白可以在论坛
上问。
MyData.h文件
///////////////////////////////////////////////////////
class CMyData
{
public:
CMyData(int Index,char* strData);
CMyData();
virtual ~CMyData();
int m_iIndex;
int GetDataSize(){ return m_iDataSize; };
const char* GetData(){ return m_strDatamember; };
//这里重载了操作符:
CMyData& operator =(CMyData &SrcData);
bool operator <(CMyData& data );
bool operator >(CMyData& data );
private:
char* m_strDatamember;
int m_iDataSize;
};
////////////////////////////////////////////////////////
MyData.cpp文件
////////////////////////////////////////////////////////
CMyData::CMyData():
m_iIndex(0),
m_iDataSize(0),
m_strDatamember(NULL)
{
}
CMyData::~CMyData()
{
if(m_strDatamember != NULL)
delete[] m_strDatamember;
m_strDatamember = NULL;
}
CMyData::CMyData(int Index,char* strData):
m_iIndex(Index),
m_iDataSize(0),
m_strDatamember(NULL)
{
m_iDataSize = strlen(strData);
m_strDatamember = new char[m_iDataSize+1];
strcpy(m_strDatamember,strData);
}
CMyData& CMyData::operator =(CMyData &SrcData)
{
m_iIndex = SrcData.m_iIndex;
m_iDataSize = SrcData.GetDataSize();
m_strDatamember = new char[m_iDataSize+1];
strcpy(m_strDatamember,SrcData.GetData());
return *this;
}
bool CMyData::operator <(CMyData& data )
{
return m_iIndex<data.m_iIndex;
}
bool CMyData::operator >(CMyData& data )
{
return m_iIndex>data.m_iIndex;
}
///////////////////////////////////////////////////////////
//////////////////////////////////////////////////////////
//主程序部分
#include <iostream.h>
#include "MyData.h"
template <class T>
void run(T* pData,int left,int right)
{
int i,j;
T middle,iTemp;
i = left;
j = right;
//下面的比较都调用我们重载的操作符函数
middle = pData[(left+right)/2]; //求中间值
do{
while((pData[i]<middle) && (i<right))//从左扫描大于中值的数
i++;
while((pData[j]>middle) && (j>left))//从右扫描大于中值的数
j--;
if(i<=j)//找到了一对值
{
//交换
iTemp = pData[i];
pData[i] = pData[j];
pData[j] = iTemp;
i++;
j--;
}
}while(i<=j);//如果两边扫描的下标交错,就停止(完成一次)
//当左边部分有值(left<j),递归左半边
if(left<j)
run(pData,left,j);
//当右边部分有值(right>i),递归右半边
if(right>i)
run(pData,i,right);
}
template <class T>
void QuickSort(T* pData,int Count)
{
run(pData,0,Count-1);
}
void main()
{
CMyData data[] = {
CMyData(8,"xulion"),
CMyData(7,"sanzoo"),
CMyData(6,"wangjun"),
CMyData(5,"VCKBASE"),
CMyData(4,"jacky2000"),
CMyData(3,"cwally"),
CMyData(2,"VCUSER"),
CMyData(1,"isdong")
};
QuickSort(data,8);
for (int i=0;i<8;i++)
cout<<data[i].m_iIndex<<" "<<data[i].GetData()<<"\n";
cout<<"\n";
}
转载 http://www.cnblogs.com/lvpei/archive/2011/03/04/1971142.html
发表评论
-
(转载) 快速排序、希尔排序、插入排序、选择排序、归并排序、堆排序总结
2012-10-17 11:14 1338一、快速排序的基本思想 设当前待排序的无序 ... -
不借助其它变量交换两变量值的三种算法
2012-10-16 10:27 1125在学习程序语言和进行程序设计的时候,交换两个变量的值是经常要使 ... -
编程珠玑开篇--磁盘文件排序问题
2012-10-16 10:07 1257转载。。。。 编程珠玑开篇--磁盘文件排序问题 ... -
求连通图中任意两个顶点的之间的所有路径
2012-03-15 22:08 0问题如图所示: 但是可能存在两种图,一种是DAG图,即深度遍 ... -
最大网络流的算法
2012-03-15 20:11 0网络最大流问题: ... -
HDFS的缺点以及相应的改进策略
2012-03-09 20:24 1309HDFS是一个不错的分布式 ... -
链表逆序输出---关于这一类型的问题
2012-03-08 22:02 0题目:输入一个链表的头结点,从尾到头反过来输出每个结点的值。链 ... -
求一个数列的最长非递增(递减)子序列
2012-03-09 16:22 8495问题描述: 给出 ... -
BFS与DFS
2012-03-04 18:10 0图深度遍历与广度遍历 ... -
字典树
2012-03-04 14:00 0trie树,即是我们所说的字典树。 典型应用是用于统计和排序 ... -
数列的排列与组合问题
2012-03-03 19:25 2718关于数列的全排列已经另外一篇文章中提到过了, 下面来介 ... -
字符串模式匹配--KMP算法
2012-03-03 09:43 0这个字符串模式匹配的算法在数据结构中可谓是非常的重要,也非常的 ... -
n-皇后以及全排列的问题--递归以及非递归的解法
2012-03-01 09:19 2398首先说下全排序的问题 这个问题可以说是最经典的问题, ... -
外排序学习(1)
2012-02-28 20:52 0首先对应到具体问题, 在网上见到的一个题目, 一个最多含有 ... -
关于链表追赶--链表中环的问题
2012-02-28 15:19 1695关于环的问题, 介绍 ... -
最大连续子数列的和问题
2012-02-28 10:57 0对应最常见的问题: 输入一个整形数组,数组里有正数也有 ... -
亲和数问题--伴随数组的简单应用
2012-02-27 22:30 0原题是求50000以内的所有亲和数;; 亲和数的定义如 ... -
在集合中寻找满足条件的两个或者多个数
2012-02-23 12:27 0对于这个类型的具体问题常见的有如下: 1.输入一个数组和一个 ... -
选取K个最小的数--学习报告
2012-02-22 19:27 0问题描述: 查找最小的k个元素 题目:输入n个整数 ... -
计数排序--小计
2012-02-21 13:48 0void CountingSort(const char *A ...
相关推荐
### 排序算法的稳定性和时间复杂度小结 #### 一、引言 排序算法是计算机科学中的基本算法之一,广泛应用于各种场景之中。排序算法不仅关注排序的速度(时间复杂度),还关注排序过程中是否能够保持相等元素原有的...
各种排序算法的稳定性和时间复杂度小结.doc
【排序算法稳定性与时间复杂度概述】 排序算法是计算机科学中的基本操作,主要目标是将一组数据按照特定顺序排列。稳定性是指排序过程中相等元素的相对顺序不会改变。稳定性对于某些应用非常重要,例如处理多个键的...
【排序算法概述】 排序算法是计算机科学中的重要组成部分,用于对一组数据进行排列,使其按照特定顺序呈现。...在学习排序算法时,不仅要看算法的效率,还要关注其稳定性和空间复杂度,以及在特定条件下的表现。
7. **交换排序和选择排序**:这两者都是基于交换元素的O(n^2)复杂度的排序算法,效率与冒泡排序相当,但在实际应用中较少使用。 8. **基数排序**:基数排序是针对整数的排序,通过按照每一位的值进行排序,从低位到...
总结各种排序算法的特性,我们可以根据数据规模、是否需要稳定性、可用空间等因素来选择合适的排序算法。在大多数情况下,快速排序、归并排序和堆排序是常用的选择,而插入排序、冒泡排序等则更适合小规模或特定条件...
5. 冒泡排序(Bubble Sort)和鸡尾酒排序(Cocktail Sort):两者都是稳定的排序算法,时间复杂度为O(n^2)。冒泡排序通过相邻元素的交换逐步将最大(或最小)元素移到序列末尾。鸡尾酒排序是冒泡排序的变种,双向...
简单排序算法如冒泡排序和选择排序虽然实现简单且易于理解,但由于其较高的时间复杂度,在处理大规模数据时效率低下。接下来的部分我们将探讨更高效的排序算法。 #### 第二部分:高级排序算法 这部分将介绍更高效的...
### 排序算法小结讲解+源码 #### 一、引言 排序算法作为计算机科学中的基础且常用算法,在实际应用中具有重要意义。随着数据量的不断增加,对排序算法的效率提出了更高要求。本文将从简单排序算法出发,逐步过渡到...
归并排序的优点在于其稳定性和较好的最坏情况性能。 ### 总结 通过对上述五种排序算法的性能比较,我们可以看到不同算法各有优劣。例如,插入排序适合小规模或部分有序的数据;冒泡排序虽然简单但效率不高;简单...
平均和最坏情况下的时间复杂度都是O(n^2),空间复杂度为O(1),它是稳定的排序算法。 - **折半插入排序**:改进了直接插入排序,通过二分查找确定插入位置,减少了比较次数,但时间复杂度仍为O(n^2),保持稳定性。 ...
这个实验旨在深入理解各种排序算法的时间复杂度,并通过实际操作来验证这些理论知识。我们将探讨以下几种常见的内排序算法:冒泡排序、选择排序、插入排序、快速排序、归并排序以及堆排序。 **冒泡排序**是一种简单...
本篇文章将详细解析Java中常见的排序方法,结合"javaeye 收集的java排序小结"资料,旨在帮助读者理解和掌握这些排序算法。 1. 冒泡排序(Bubble Sort) 冒泡排序是最简单的排序算法之一,通过重复遍历数组,比较...
这表明任何基于比较的排序算法的最坏情况下的时间复杂度至少为Ω(n log n)。 ### 第3章 - 增长阶函数 #### 3.1 渐进记号 - **3.1-1**:定义并理解大O、小o、θ、Ω和ω记号。 - **3.1-2**:比较不同渐进记号之间...
- **稳定性**:排序算法的稳定性是指相等元素之间的相对位置是否会被保持。冒泡排序是稳定的,而交换排序则是不稳定的。 通过对以上知识点的详细解析,我们可以更深入地理解这些基础排序算法的工作原理及其在实际...
时间复杂度为 O(n^2),空间复杂度为 O(1),稳定性较好。适用于小规模数据排序。 ```cpp void insertSort(comparable* array, int length) { for (int i = 1; i ; i++) { comparable temp = array[i]; int j =...