`
duanhengbin
  • 浏览: 384688 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

Java程序员应当掌握的排序算法

 
阅读更多

今天总结一下JDK中采用的排序算法,主要出现在两个类中。

 

java.util.Arrays

 

static void sort(int[] a)

static void sort(int[] a, int fromIndex, int toIndex)

 

其他基本类型(byte,char,short,long,float,double)算法相同。float 和 double 多了两步long型本地转换的步骤,主要处理NaN值

以上基本类型数组的排序方法的 采用了一个经过调优的快速排序法。

 

static <T> void sort(T[] a, Comparator<? super T> c)
static <T> void sort(T[] a, int fromIndex, int toIndex, Comparator<? super T> c)
java.util.Collections 类的 sort方法 实际调用了上面的方法

对象数组则 采用了经过修改的归并排序算法。(如果低子列表中的最高元素小于高子列表中的最低元素,则忽略合并)。

 

java.util.PriorityQueue

 

一个基于优先级堆的无界优先级队列(基于堆排序算法)

 

【基础原理】
快速排序(QuickSort) 时间复杂度  平均O(nlogn)  最坏O(n2)  空间复杂度 O(nlogn) 不稳定
算法:

# 选取中枢点
swap a[1,rand(1,n)]

# 以中枢点为界分割成大小两部分
k = 1
for i = 2:n, if a[i] < a[1], swap a[++k,i]
swap a[1,k]
→ invariant: a[1..k-1] < a[k] <= a[k+1..n]

# 对两部分做递归排序
sort a[1..k-1]
sort a[k+1,n]

 

虽然不够稳定,但是实际应用中快速排序比大部分排序算法都要快。


归并排序(MergeSort) 时间复杂度 O(nlogn)  空间复杂度 O(1)  稳定
算法:

# 数组均分为两块
m = n / 2

# 两块分别递归
sort a[1..m]
sort a[m+1..n]

# 使用中间数组做排序
b = copy of a[1..m]
i = 1, j = m+1, k = 1
while i <= m and j <= n,
    a[k++] = (a[j] < b[i]) ? a[j++] : b[i++]
    → invariant: a[1..k] in final position
while i <= m,
    a[k++] = b[i++]
    → invariant: a[1..k] in final position

 

归并排序比堆排序快,但是需要比堆排序多一倍的内存空间,因为它需要一个额外的数组。

最终归并排序依靠其稳定性拿到了JDK排序中的头把交椅,被应用于使用最广泛的对象集合排序中。

堆排序(HeapSort) 时间复杂度 O(nlogn)  空间复杂度 O(1) 不稳定
算法:

# 构造堆
for i = n/2:1, sink(a,i,n)
→ invariant: a[1,n] in heap order

# 循环下沉
for i = 1:n,
    swap a[1,n-i+1]
    sink(a,1,n-i)
    → invariant: a[n-i+1,n] in final position
end

# 从 i 到 a[1..n] 递归sink
function sink(a,i,n):
    # {lc,rc,mc} = {left,right,max} child index
    lc = 2*i
    if lc > n, return # no children
    rc = lc + 1
    mc = (rc > n) ? lc : (a[lc] > a[rc]) ? lc : rc
    if a[i] >= a[mc], return # heap ordered
    swap a[i,mc]
    sink(a,mc,n)

 
堆排序适合于数据量非常大的场合,由于较少的空间消耗,在移动设备中,堆排序是首选。(相比使用递归的快速排序,归并排序,没有堆栈溢出的风险)

 

【代码分析】

相比来说快速排序的排序运用最为广泛,也是算法演变最多的一种。我们看分析下JDK中的快速排序。

 

    public static void sort(int[] a) {
    sort1(a, 0, a.length);
    }

    private static void sort1(int x[], int off, int len) {
    // 小于7时使用插入排序法
    // Insertion sort on smallest arrays
    if (len < 7) {
        for (int i=off; i<len+off; i++)
        for (int j=i; j>off && x[j-1]>x[j]; j--)
            swap(x, j, j-1);
        return;
    }

    // Choose a partition element, v
    int m = off + (len >> 1);       // Small arrays, middle element
    //根据当前数组大小确定选取枢轴策略
    //size=7时,直接取中间元素作为枢轴    
    //7<size<=40时,取数组头中尾三个节点的中数作为枢轴    
    //size>40时,将数组8等分后获取9个节点值得中数作为枢轴 
    if (len > 7) {
        int l = off;
        int n = off + len - 1;
        if (len > 40) {        // Big arrays, pseudomedian of 9
        int s = len/8;
        l = med3(x, l,     l+s, l+2*s);
        m = med3(x, m-s,   m,   m+s);
        n = med3(x, n-2*s, n-s, n);
        }
        m = med3(x, l, m, n); // Mid-size, med of 3
    }
    int v = x[m];

    // Establish Invariant: v* (<v)* (>v)* v*
    //这一段代码比较难理解,也是关键点。基本思路是:
    //  先将数组交换为 v* (<v)* (>v)* v* 的格局,即中值向两边移动
    //  再将相同的数移向数组的中部。
    //算法一个特点是中值会全部排序到位,当取到重复率高的值时,以后的排序对象就会缩小很多
    //论文中提到,这里等效于著名的“荷兰国旗问题”,该方法对于高度重复的数组整体排序时间节省20%
    int a = off, b = a, c = off + len - 1, d = c;
    while(true) {
        while (b <= c && x[b] <= v) {
        if (x[b] == v)
            swap(x, a++, b);
        b++;
        }
        while (c >= b && x[c] >= v) {
        if (x[c] == v)
            swap(x, c, d--);
        c--;
        }
        if (b > c)
        break;
        swap(x, b++, c--);
    }

    // Swap partition elements back to middle
    int s, n = off + len;
    s = Math.min(a-off, b-a  );  vecswap(x, off, b-s, s);
    s = Math.min(d-c,   n-d-1);  vecswap(x, b,   n-s, s);

    // Recursively sort non-partition-elements
    if ((s = b-a) > 1)
        sort1(x, off, s);
    if ((s = d-c) > 1)
        sort1(x, n-s, s);
    }

    // 这个函数 将分到两边的数移向数组的中部
    private static void vecswap(int x[], int a, int b, int n) {
    for (int i=0; i<n; i++, a++, b++)
        swap(x, a, b);
    }

    private static int med3(int x[], int a, int b, int c) {
    return (x[a] < x[b] ?
        (x[b] < x[c] ? b : x[a] < x[c] ? c : a) :
        (x[b] > x[c] ? b : x[a] > x[c] ? c : a));
    }

    private static void swap(int x[], int a, int b) {
    int t = x[a];
    x[a] = x[b];
    x[b] = t;
    }

 ( 更详细的描述参考 Jon L. Bentley 和 M. Douglas McIlroy  的论文《Engineering a Sort Function》。JDK源码中除了把原文中C语言的宏换成了函数,其他完全一致。)

 

【参考

经典参考书:《算法》(第4版)Sedgewick 著

一个不错的排序算法网站:www.sorting-algorithms.com

论文原文:http://www.enseignement.polytechnique.fr/informatique/profs/Luc.Maranget/421/09/bentley93engineering.pdf

 

分享到:
评论

相关推荐

    程序员必须掌握!Java常用的8大排序算法

    Java常用的8大排序算法是程序员必备的技能之一,这些排序算法根据排序过程中是否需要使用额外的存储...综上所述,Java程序员掌握以上排序算法,可以更好地应对日常工作中遇到的各类排序问题,提升编程效率和程序性能。

    Java常用排序算法&程序员必须掌握的8大排序算法+二分法查找

    综上所述,掌握这些排序算法和二分查找技巧对于Java程序员来说至关重要,它们不仅能提升编程能力,也有助于解决实际问题,提高代码的运行效率。通过学习和实践,你将能够更好地应对各种编程挑战。

    Java常用排序算法程序员必须掌握的8大排序算法

    冒泡排序--Java常用排序算法程序员必须掌握的8大排序算法

    Java常用排序算法程序员必须掌握的8大排序算法Java开

    在编程领域,排序算法是每个开发者都需要理解和掌握的基础知识,特别是在Java编程中。本文将深入探讨Java中的八大常用排序算法,这些算法对于提升程序效率、优化数据处理具有重要意义。这8大排序算法包括:冒泡排序...

    java程序员必知的8大排序

    在编程领域,排序算法是基础且重要的概念,对于Java程序员来说,理解并掌握各种排序算法能提升编程能力。以下是8种常见的排序算法及其基本思想、实现方式的详细解释: 1. 直接插入排序: - 基本思想:将未排序的...

    Java程序员面试笔试宝典-何昊pdf版

    2. **算法与数据结构**:很多公司在招聘Java工程师时会考察候选人对于基础算法和数据结构的掌握程度,如排序算法、链表、二叉树等。 3. **项目经验分享**:通过实际案例分析,让读者了解如何将所学知识应用到实际...

    Java程序员必知的8大排序

    Java程序员在日常开发中,掌握各种排序算法是提高效率、优化代码的关键。以下是对Java排序算法的详细解析,包括直接插入排序、希尔排序和简单选择排序。 1. 直接插入排序 直接插入排序是一种简单直观的排序算法,它...

    Java排序算法大全

    Java排序算法大全是一份专为Java开发者准备的学习资源,涵盖了各种经典的排序算法,旨在帮助初学者和有经验的程序员深入理解排序的原理和实现。排序是计算机科学中的基础且重要的概念,它在数据处理、数据库操作、...

    Java常用排序算法&程序员必须掌握的8大排序算法+二分法查找(同步到博客).doc

    【Java 常用排序算法】排序是编程中常见的任务之一,主要分为四类:插入排序、交换排序、选择排序和归并排序。此外,还有分配排序中的基数排序。以下是对这些排序算法的详细说明: 1. **直接插入排序**: 直接插入...

    java实现常见排序算法

    了解和掌握这些排序算法不仅有助于提升编程能力,也是解决实际问题的基础,尤其是在大数据处理和性能优化方面。在实际应用中,根据数据特点选择合适的排序算法至关重要,例如,希尔排序对于大规模数据的初步排序非常...

    Java程序员进化为架构师掌握的知识

    1. **排序算法**:掌握各种排序算法,例如快速排序、归并排序、插入排序等。 2. **斐波那契数列**:理解斐波那契数列的原理和应用场景。 3. **二分查找**:掌握二分查找算法。 4. **全排列**:理解全排列的实现原理...

    Java实现九大排序算法.rar

    本资源"Java实现九大排序算法.rar"包含的九种排序算法是编程学习的经典内容,对于提升Java程序员的技能非常有帮助。 1. 冒泡排序(Bubble Sort): 冒泡排序是一种简单的排序算法,通过重复遍历数组,比较相邻元素...

    java四大排序算法总结.zip

    总的来说,理解和掌握这些基础排序算法是每个Java程序员必备的技能,它们不仅有助于提升编程能力,也是深入学习高级算法和数据结构的基础。通过不断的实践和学习,我们可以更好地应对各种编程挑战。

    Java实现常用排序算法

    无论是插入排序的稳定性和局部性,快速排序的高效性,还是归并排序的稳定性与空间需求,都是Java程序员应掌握的基础知识。同时,了解这些排序算法的优缺点,有助于在实际编程中根据数据特性选择合适的排序方法。

    Java程序员面试笔试宝典

    除此之外,数据库连接和SQL查询也是Java程序员需要掌握的技能。了解如何使用JDBC执行SQL语句,处理结果集,以及优化SQL查询,对于提高应用程序的性能具有重要意义。 对于现代Java开发,理解JVM(Java虚拟机)的工作...

    java程序员c程序员简历模板

    4. **算法与数据结构**:展示对常见算法和复杂数据结构的掌握,如排序、查找算法及链表、树等数据结构的应用。 5. **编译与链接**:描述对GCC、Makefile等工具的使用,以及如何优化编译过程。 6. **质量保证**:...

    Java常见排序算法源码集.rar

    在编程领域,排序算法是计算机科学中的核心概念,尤其是在Java这样的高级编程语言中。这个名为"Java常见排序算法源码集.rar"的压缩文件显然包含了多种常用的排序算法的Java实现,对于初学者来说,这是一个非常宝贵的...

    Java程序员面试宝典 算法题

    * 排序算法笔试模拟题精解之“数组变换” + 题目描述:给出一个长度为 n 的数组,和一个正整数 d。你每次可以选择其中任意一个元素 a[i] 将其变为 a[i] + d 或 a[i] - d,这算作一次操作。你需要将所有的元素全部...

    Java程序员面试宝典.rar

    《Java程序员面试宝典》是Java开发者在求职面试过程中的一份重要参考资料,它涵盖了Java编程的基础、进阶以及面试常见问题。这份压缩包文件包含了一本名为“2008820190118.chm”的帮助文档,很可能是详细整理的面试...

Global site tag (gtag.js) - Google Analytics