`
北极的。鱼
  • 浏览: 158978 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

【转】漫谈经典排序算法:五、线性时间排序(计数、基数、桶排序)比较

 
阅读更多

转自: http://blog.csdn.net/touch_2011/article/details/6787127

 

1、计数排序

          1.1 引出

            前面四篇博客中,所有的排序算法都存在比较,都可以称为”比较排序“。比较排序的下界为o(nlogn)。那么有没有时间复杂度为o(n)的线性时间排序算法呢?计数排序便是很基础的一种线性时间排序,它是基数排序的基础。基本思想是:对每一个元素x,确定小于x的元素个数,就可以把x直接放到它在有序序列中的位置上。过程描述:假设待排序序列a中值的范围[0,k],其中k表示待排序序列中的最大值。首先用一个辅助数组count记录各个值在a中出现的次数,比如count[i]表示i在a中的个数。然后依次改变count中元素值,使count[i]表示a中不大于i的元素个数。然后从后往前扫描a数组,a中的元素根据count中的信息直接放到辅助数组b中。最后把有序序列b复制到a。

#include<stdio.h>
#include<stdlib.h>

//计数排序,n为数组a的记录个数,k为记录中最大值
void countingSort(int *a,int n,int k)
{
	int i;
	int *count=(int *)malloc(sizeof(int)*(k+1));
	int *b=(int *)malloc(sizeof(int)*(n+1));
	//初始化计数数组count
	for(i=0;i<=k;i++)
		*(count+i)=0;
	//计算等于a[i]的记录个数
	for(i=1;i<=n;i++)
		(*(count+a[i]))++;
	//计算小于等于a[i]的记录个数
	for(i=1;i<=k;i++)
        *(count+i) += *(count+i-1);
	//扫描a数组,把各个元素放在有序序列中相应的位置上
	for(i=n;i>=1;i--){
		*(b + *(count + a[i]))=a[i];
        (*(count+a[i]))--; 
	}
	for(i=1;i<=n;i++)
		a[i]=*(b+i);
	free(count);
	free(b);
}

void main()
{
	int i;
	int a[7]={0,3,5,8,9,1,2};//不考虑a[0]
	countingSort(a,6,9);
	for(i=1;i<=6;i++)
		printf("%-4d",a[i]);
	printf("\n");
}

 

 1.2 效率分析

从代码来看,计数排序有5个for循环,其中三个时间是n,两个时间是k。所以总时间T(3n+2k),时间复杂度o(n+k),不管是在最坏还是最佳情况下,此时间复杂度不变.此外,计数排序是稳定的,辅助空间n+k,这个空间是比较大的,计数排序对待排序序列有约束条件(如前面我们假设待排序序列a中值的范围[0,k],其中k表示待排序序列中的最大值),元素值需是非负数,k太大的话会大大降低效率。这里要注意的是 “扫描a数组把各个元素放在有序序列相应的位置上” 这步为什么要从后往前扫描a数组呢?大家想一想计数排序的过程就知道,因为从前扫描导致计数排序不稳定,前面说了,计数排序是基数排序的基础,所以它的稳定性直接影响到基数排序的稳定。

2、基数排序

          2.1 引出

            在计数排序中,当k很大时,时间和空间的开销都会增大(可以想一下对序列{8888,1234,9999}用计数排序,此时不但浪费很多空间,而且时间方面还不如比较排序)。于是可以把待排序记录分解成个位(第一位)、十位(第二位)....然后分别以第一位、第二位...对整个序列进行计数排序。这样的话分解出来的每一位不超过9,即用计数排序序列中最大值是9.

          2.2 代码

#include<stdio.h>
#include<stdlib.h>
#include<math.h>


//计数排序,n为数组a的记录个数,k为记录中最大值,按第d位排序
void countingSort(int *a,int n,int k,int d)
{
	int i;
	int *count=(int *)malloc(sizeof(int)*(k+1));
	int *b=(int *)malloc(sizeof(int)*(n+1));
	//初始化计数数组count
	for(i=0;i<=k;i++)
		*(count+i)=0;
	//计算等于a[i]在d位(a[i]/(int)pow(10,d-1)%10)的记录个数
	for(i=1;i<=n;i++)
        (*(count+a[i]/(int)pow(10,d-1)%10))++;

	//计算小于等于a[i]在d位(a[i]/(int)pow(10,d-1)%10)的记录个数
	for(i=1;i<=k;i++)
        *(count+i) += *(count+i-1);
	//扫描a数组,把各个元素放在有序序列中相应的位置上
	for(i=n;i>=1;i--){
		*(b + *(count + a[i]/(int)pow(10,d-1)%10))=a[i];
        (*(count+a[i]/(int)pow(10,d-1)%10))--; 
	}
	for(i=1;i<=n;i++)
		a[i]=*(b+i);
	free(count);
	free(b);
}


//基数排序,n为数组a的记录个数,每一个记录中有d位数字
void radixSort(int *a,int n,int d)
{
	int i;
	for(i=1;i<=d;i++){
	    countingSort(a,6,9,i);
	}
}

void main()
{
	int i;
	int a[7]={0,114,118,152,114,111,132};//不考虑a[0]
	radixSort(a,6,3);
	for(i=1;i<=6;i++)
		printf("%-4d",a[i]);
	printf("\n");
}

 

 2.3 效率分析

基数排序时间T(n)=d*(2k+3n),其中d是记录值的位数,(2k+3n)是每一趟计数排序时间,上文分析过了,k不超过9,d的值一般也很小,k、d都可以看成是一个很小的常数,所以时间复杂度o(n)。最坏最佳情况并不改变时间复杂度。基数排序是稳定的。辅助空间同计数排序k+n.

3、桶排序

          3.1 引出

            同计数排序一样,桶排序也对待排序序列作了假设,桶排序假设序列由一个随机过程产生,该过程将元素均匀而独立地分布在区间[0,1)上。基本思想是:把区间[0,1)划分成n个相同大小的子区间,称为桶。将n个记录分布到各个桶中去。如果有多于一个记录分到同一个桶中,需要进行桶内排序。最后依次把各个桶中的记录列出来记得到有序序列。

          3.2 代码

#include<stdio.h>
#include<stdlib.h>

//桶排序
void bucketSort(double* a,int n)
{
	//链表结点描述
	typedef struct Node{
		double key;
        struct Node * next; 
	}Node;
	//辅助数组元素描述
	typedef struct{
         Node * next;
	}Head;
	int i,j;
    Head head[10]={NULL};
	Node * p;
	Node * q;
	Node * node;
	for(i=1;i<=n;i++){
		node=(Node*)malloc(sizeof(Node));
		node->key=a[i];
		node->next=NULL;
		p = q =head[(int)(a[i]*10)].next;
		if(p == NULL){
			head[(int)(a[i]*10)].next=node;
			continue;
		}
		while(p){
            if(node->key < p->key)
				break;
			q=p;
			p=p->next;
		}
		if(p == NULL){
			q->next=node;
		}else{
			node->next=p;
			q->next=node;
		}
	}
	j=1;
	for(i=0;i<10;i++){
    	p=head[i].next;
		while(p){
			a[j++]=p->key;
			p=p->next;
		}
	}
}

void main()
{
	int i;
	double a[13]={0,0.13,0.25,0.18,0.29,0.81,0.52,0.52,0.83,0.52,0.69,0.13,0.16};//不考虑a[0]
	bucketSort(a,12);
	for(i=1;i<=12;i++)
		printf("%-6.2f",a[i]);
	printf("\n");
}

 

   3.3 效率分析

当记录在桶中分布均匀时,即每个桶只有一个元素,此时时间复杂度o(n)。因此桶排序适合对很少重复的记录排序。辅助空间2n。桶排序是稳定的排序,实现比较复杂。

分享到:
评论

相关推荐

    架构漫谈(王概凯架构系列文章整理)

    架构漫谈(五):什么是软件 架构漫谈(六):软件架构到底是要解决什么问题? 架构漫谈(七):不要空设架构师这个职位,给他实权 架构漫谈(八):从架构的角度看如何写好代码 架构漫谈(九):理清技术、业务和...

    漫谈Wine之二:Windows的文件操作

    ### 漫谈Wine之二:Windows的文件操作 #### 一、引言 Wine项目旨在让Windows应用程序能够在类Unix系统(如Linux)上运行,而不需实际安装Windows操作系统。为了更好地理解和实现这一目标,本文将深入探讨Windows与...

    漫谈Wine之一:Wine的系统结构.pdf

    ### 漫谈Wine之一:Wine的系统结构 #### 一、Wine简介及研究背景 **Wine**(Wine Is Not an Emulator)是一个兼容层,旨在允许在类Unix系统(如Linux)上运行Microsoft Windows应用程序。本文档主要探讨Wine的核心...

    漫谈兼容内核.zip

    漫谈兼容内核之五:Kernel-win32的系统调用机制 漫谈兼容内核之六:二进制映像的类型识别 漫谈兼容内核之七:Wine的二进制映像装入和启动 漫谈兼容内核之八:ELF映像的装入(一) 漫谈兼容内核之九:ELF映像的装入(二)...

    [精选]漫谈注册会计师:我八年的梦成真.pptx

    [精选]漫谈注册会计师:我八年的梦成真.pptx

    C++经典数值算法源码

    本资源“C++经典数值算法源码”聚焦于数值计算,提供了各种常用且重要的算法实现,对于学习C++编程以及数值计算方法的开发者来说,这是一个宝贵的资料库。 首先,让我们逐一探讨这些算法: 1. **插值**:插值是一...

    漫谈兼容内核.7z

    ReactOS怎样实现系统调用.pdf 漫谈兼容内核之二:关于kernel -win32的对象管理.pdf 漫谈兼容内核之三:关于kernel-win32的文件操作.pdf 漫谈兼容内核之四:Kernel-win32的进程管理.pdf 漫谈兼容内核之五:...

    漫谈Wine之四:内核差异核内补

    ### 漫谈Wine之四:内核差异核内补 #### 一、引言 随着开源软件的发展,跨平台应用的需求日益增加。其中,Wine作为一个知名的兼容层,致力于让用户能够在类Unix系统(如Linux)上运行Windows应用程序。然而,在...

    漫谈兼容内核[pdf]

    01.漫谈兼容内核之一:Wine的系统结构.pdf 02.漫谈兼容内核之二:关于kernel-win32的对象管理.pdf 03.漫谈兼容内核之三:关于kernel-win32的文件操作.pdf 04.漫谈兼容内核之四:Kernel-win32的进程管理.pdf 05.漫谈...

    漫谈Wine之三:Wine环境下的文件读写

    ### 漫谈Wine之三:Wine环境下的文件读写 #### 一、Wine简介及文件操作概述 Wine(Wine Is Not an Emulator)是一种兼容层技术,它允许用户在类Unix系统(如Linux或BSD)上运行Windows应用程序。Wine的核心思想是...

    Windows之漫谈兼容内核

    漫谈兼容内核之一:ReactOS怎样实现系统调用 漫谈兼容内核之二:关于kernel-win32的对象管理 漫谈兼容内核之三:Kernel-win32的文件操作 漫谈兼容内核之四:Kernel-win32的进程管理 漫谈兼容内核之五:Kernel-win32...

    量化漫谈系列之五:中证2000指数发布,如何构建微盘股指数增强策略?-20230830-国金证券-17页.pdf

    【量化漫谈系列之五:中证2000指数发布,如何构建微盘股指数增强策略?】 这篇报告主要探讨了中证2000指数的特性以及如何利用因子策略来实现对国证2000指数的增强。中证2000指数作为小微盘股的代表,其平均市值较低...

    工业4.0漫谈(五):物联网在生产制造.docx

    通过部署传感器、SCADA或DCS系统,企业能够实时获取设备运行参数,如运行时间、速度和生产效率。这些数据经过云端处理,转化为关键绩效指标(KPIs),如总体设备效率(OEE)和待机时间等。例如,BC Machining LLC...

    工业4.0漫谈(五):物联网在生产制造.pdf

    这些数据经过分析,转化为关键绩效指标(KPIs),例如总体设备效率(OEE)和待机时间,有助于识别瓶颈和提高生产线的效率。例如,BC Machining LLC通过实时监控其数控机床的利用率,成功提升了生产效率。 其次,...

    投研漫谈(一):多因子和人工智能谁是“正规军”?~兼谈金融预测框架-20191111-浙商证券-22页.pdf

    "投研漫谈(一):多因子和人工智能谁是“正规军”?~兼谈金融预测框架" 本文主要讨论了多因子模型和人工智能在金融预测框架中的应用和比较。文章首先介绍了资产定价中心公式的理论基础,并阐述了随机折现因子的...

    20201030-中信建投-多元金融行业消金漫谈系列之一:消费金融产业全景.pdf

    20201030-中信建投-多元金融行业消金漫谈系列之一:消费金融产业全景.pdf

    漫谈兼容内核

    01.漫谈兼容内核之一:Wine的系统结构.pdf 02.漫谈兼容内核之二:关于kernel-win32的对象管理.pdf 03.漫谈兼容内核之三:关于kernel-win32的文件操作.pdf 04.漫谈兼容内核之四:Kernel-win32的进程管理.pdf 05....

    Linux wine技术详解

    《漫谈Wine之一:Wine的系统结构.pdf》可能会详细介绍这些组件如何协同工作,包括Wine如何模拟Windows的进程管理、内存模型以及线程机制。 其次,Windows的文件操作在Linux Wine环境中也是一个关键话题。《漫谈Wine...

    《windows内核情景分析》上册前身—漫谈wine

    《windows内核情景分析》上册前身 漫谈Wine之一:Wine的系统结构.pdf 漫谈Wine之三:Wine环境下的文件读写.pdf 漫谈Wine之二:Windows的文件操作.pdf 漫谈Wine之四:内核差异核内补.pdf

Global site tag (gtag.js) - Google Analytics