`
RednaxelaFX
  • 浏览: 3052897 次
  • 性别: Icon_minigender_1
  • 来自: 海外
社区版块
存档分类
最新评论

趣味编程:函数式链表的快速排序

    博客分类:
  • C#
阅读更多
(恢复自2009-08-28的备份。幸好做了备份,不然换机房过程中损失的8小时数据就……)

题目

老赵趣味编程:函数式链表的快速排序一帖中出了个题目,说:
Jeffrey Zhao 写道
前一段时间有朋友问我,以下这段Haskell快速排序的代码,是否可以转化成C#中等价的Lambda表达式实现:
qsort [] = []
qsort (x:xs) = qsort (filter (< x) xs) ++ [x] ++ qsort (filter (>= x) xs)

我当时回答,C#中缺少一些基础的数据结构,因此不行。经过补充之后,就没有任何问题了。后来,我觉得这个问题挺有意思,难度适中,也挺考察“基础编程”能力的,于是就自己写了一个。如果您感兴趣的话,也不妨一试。

那我也来凑个热闹来做做吧~肯定会有人能写得很简短精悍,我就反其道而行,写个又长又啰嗦的版本出来 ;-p
顺带一提:老赵原文中确实是说“C#中等价的Lambda表达式”,但从后面老赵提供的代码模板来看,似乎并不是想让读者真的用一个lambda表达式就解决问题。我这里尽量跟随代码模板做。

======================================================================

预备知识

老赵在原帖里对涉及的Haskell版qsort函数做了解释,请先参照之。我这里补充些我自己的理解。

首先是“表”的概念。在众多函数式语言中,不可变的表都是核心数据结构之一。它可以定义如下:(使用Haskell记法)
(1)空表[]是一个表。
(2) 将一个元素x连接在一个表l之前,构成的x:l也是一个表。此时x称为新表的头(head),l称为新表的尾(tail)。
(3) 在有限步数内应用(2)得到的是一个表。
这是一种递归定义法,其中(1)称为basis step,(2)称为recursive step,(3)称为closure step。这个闭包是指Kleene闭包。

Haskell记法中,含有多个元素的表可以写为这种形式:
[x, y, z]

实际上它是前面的表的定义的简写:
x : y : z : []

冒号表示连接,习惯上也叫cons。

可以看出,这种表结构可以很直观的用链表来实现。不过有点麻烦的是,表的基础——空表无法分解为头和尾,所以相关操作要注意空表的特例。下面会再提到。

其次是函数。写Haskell程序的一个好习惯就是通过类型来理解函数的意义。把老赵给的例子的代码补全,如下:
qsort :: (Ord a) => [a] -> [a]
qsort [] = []
qsort (x:xs) = qsort (filter (< x) xs) ++ [x] ++ qsort (filter (>= x) xs)

在开头加上了qsort函数的类型声明。注意到该函数的参数类型是[a],也就是元素类型为a的表;返回值类型也是[a]。a是一个泛型参数,但带有限制:它必须是Ord这个typeclass的实例。Ord定义如下:
class (Eq a) => Ord a where
  compare :: a -> a -> Ordering
  (<) :: a -> a -> Bool
  (>=) :: a -> a -> Bool
  (>) :: a -> a -> Bool
  (<=) :: a -> a -> Bool
  max :: a -> a -> a
  min :: a -> a -> a

Ord是继承自Eq类的,定义了上述方法。正是因为qsort的泛型参数a带有Ord的“限制”,所以在函数里可以自然的使用<和>=这两个函数,Ord保证这两个函数的存在。

如果要映射到C#的话,虽然不能按原本的概念直接映射,不过勉强可以找到一个类似效果的语言结构:泛型约束。类似这样:
public static ImmutableList<T> QuickSort<T>(
    this ImmutableList<T> src) where T : IComparable<T> {
    // ...
}

IComparable<T>接口上的CompareTo()方法足够表达Ord typeclass需要的运算了,只是没那么方便……
老赵给的代码模板里不是通过泛型约束,而是通过传一个compare函数来解决判断大小的问题。这么做也可以达到目的没错,不过比泛型约束跟原Haskell代码的差异又大些。

关于函数还有一点,就是Haskell的函数是单一参数单一返回值的。我在写这次的代码时有一版本是用x => y => x.CompareTo(y)之类的写法来应对Haskell原本的代码的特征。后来觉得算了,这个例子里这么写意义不大。

然后Haskell的lazy求值在这个例子里也没有明显体现,不展开了。

说来……好的快速排序的实现关键就是选好pivot。老赵原本给的Haskell代码就是以表中第一个元素为pivot,虽然不太好不过我也懒得写得更麻烦,就跟了 =u=

======================================================================

关于实现

OK,那么我们需要实现一个不可改变的单向链表,很简单对吧。C里要自己写个链表那还不是再普通不过的事情了,
typedef struct tagNode {
    int value;
    struct tagNode* next;
} Node;

咋表示结尾呢?往next扔个NULL就是了呗。
……好吧,但这题不是要用C做。

留意到前文提到空表的特例。如果选择使用null来表现空表,虽然可以很好的表现出它不支持头和尾的拆分,但同时会带来诸多麻烦——必须要到处检查null避免遇到NullReferenceException。有一种减少null带来的麻烦的办法,叫做空对象模式Null Object Pattern)。该模式的关键在于提供一个正常的接口,在为正常状况给出一个实现之外,为“空对象”的特例情况也实现该接口。这里提到的“接口”是泛指一种抽象,而不是特指Java或者C#中的interface。

老赵原本提供的代码模板是使用null来表现空表的。后来我建议用空对象模式后老赵做了些修改,但跟我预期的不一样。下面我给出的代码是按照我对空对象模式的理解的实现。

其实与其说是从空对象模式获得灵感,我下面的代码中很多习惯都是从DLR的代码中学来的。例如不对外提供公共的构造器,而是提供更可控制的工厂方法,根据需要返回不同的特化的子类实例。又例如将字符串字面量放到一个静态类中统一管理,抛出的异常也如法炮制。
工厂方法还有一个妙用就是充分利用C#的类型推导,可以少写些类型参数,舒畅。我本来只在ImmutableList<T>上写了Of()方法,后来写到Main()要用这方法时想起来居然还得写T是什么,不爽了,就在ImmutableList静态类上加了个Of<T>()来解决问题,爽多了。Java里这招也是常用,看看Google Collections Library里这种技巧应用的密度……

代码如下。本来最好是分成多个文件的,既然是为发帖而写的就不管了,都凑在一起也罢。
using System;
using System.Collections;
using System.Collections.Generic;
using System.Diagnostics;

namespace TestImmutableDataStructure {
    // Represents an immutable list.
    //
    // A proper list is one that holds the first element in its head,
    // and the rest of the elements as a sublist in its tail.
    // A tail with an empty list denotes the end of list.
    // An empty list has no head or tail.
    // The tail of a non-empty list, must not be null.
    public abstract class ImmutableList<T> : IEnumerable<T> {
        public static readonly ImmutableList<T> Empty =
            EmptyImmutableList<T>.Instance;

        #region Factory methods

        // create a list from an array of items
        public static ImmutableList<T> Of( params T[ ] items ) {
            Debug.Assert( null != items );

            var length = items.Length;
            // if ( 0 == items.Length ) return Empty;

            ImmutableList<T> result = Empty;
            for ( var i = length - 1; i >= 0; i-- ) {
                result = Cons( items[ i ], result );
            }

            return result;
        }

        // constructs a list by prepending the head onto the tail
        public static ImmutableList<T> Cons( T head, ImmutableList<T> tail ) {
            return new NonEmptyImmutableList<T>( head, tail );
        }

        #endregion

        #region Constructors

        protected ImmutableList( ) { }

        #endregion

        public abstract T Head { get; }
        public abstract ImmutableList<T> Tail { get; }
        public abstract bool IsEmpty { get; }

        #region IEnumerable<T> Members

        public abstract IEnumerator<T> GetEnumerator( );

        #endregion

        #region IEnumerable Members

        IEnumerator IEnumerable.GetEnumerator( ) {
            return GetEnumerator( );
        }

        #endregion
    }

    // Represents the special case of an empty list.
    internal class EmptyImmutableList<T> : ImmutableList<T> {
        public static readonly EmptyImmutableList<T> Instance =
            new EmptyImmutableList<T>( );

        public override T Head {
            get { throw Errors.ListIsEmpty; }
        }

        public override ImmutableList<T> Tail {
            get { throw Errors.ListIsEmpty; }
        }

        public override bool IsEmpty {
            get { return true; }
        }

        public override IEnumerator<T> GetEnumerator( ) {
            yield break;
        }
    }

    // Represents a non-empty list.
    internal class NonEmptyImmutableList<T> : ImmutableList<T> {
        private T _head;
        private ImmutableList<T> _tail;

        internal NonEmptyImmutableList( T head, ImmutableList<T> tail ) {
            Debug.Assert( null != tail );

            _head = head;
            _tail = tail;
        }

        public override T Head {
            get { return _head; }
        }

        public override ImmutableList<T> Tail {
            get { return _tail; }
        }

        public override bool IsEmpty {
            get { return false; }
        }

        public override IEnumerator<T> GetEnumerator( ) {
            ImmutableList<T> list = this;
            while ( !list.IsEmpty ) {
                yield return list.Head;
                list = list.Tail;
            }
        }
    }

    // ImmutableList<T> extensions and convience methods
    public static class ImmutableList {
        // convience method for creating a list with ease of type inference
        public static ImmutableList<T> Of<T>( params T[ ] items ) {
            return ImmutableList<T>.Of( items );
        }

        // convience extension method for constructing a list
        // by prepending the head onto the tail
        public static ImmutableList<T> Cons<T>(
            this T head,
            ImmutableList<T> tail ) {
            if ( null == tail ) throw Errors.ArgumentIsNull( "tail" );

            return ImmutableList<T>.Cons( head, tail );
        }

        // concatenates two lists
        public static ImmutableList<T> Concat<T>(
            this ImmutableList<T> first,
            ImmutableList<T> second ) {
            if ( null == first ) throw Errors.ArgumentIsNull( "first" );
            if ( null == second ) throw Errors.ArgumentIsNull( "second" );

            if ( first.IsEmpty ) return second;
            return first.Head.Cons( first.Tail.Concat( second ) );
        }

        // filters a list with a predicate
        public static ImmutableList<T> Where<T>(
            this ImmutableList<T> src,
            Func<T, bool> pred ) {
            if ( null == src ) throw Errors.ArgumentIsNull( "src" );
            if ( null == pred ) throw Errors.ArgumentIsNull( "pred" );

            return src.WhereCore( pred );
        }

        private static ImmutableList<T> WhereCore<T>(
            this ImmutableList<T> src,
            Func<T, bool> pred ) {
            if ( src.IsEmpty ) return src;

            var head = src.Head;
            if ( pred( head ) ) {
                return head.Cons( src.Tail.WhereCore( pred ) );
            } else {
                return src.Tail.WhereCore( pred );
            }
        }

        // quicksorts a list
        public static ImmutableList<T> QuickSort<T>(
            this ImmutableList<T> src )
            where T : IComparable<T> {
            return src.QuickSort( ( x, y ) => x.CompareTo( y ) );
        }

        // quicksorts a list
        public static ImmutableList<T> QuickSort<T>(
            this ImmutableList<T> src,
            Func<T, T, int> compare ) {
            if ( null == src ) throw Errors.ArgumentIsNull( "src" );

            return src.QuickSortCore( compare );
        }

        private static ImmutableList<T> QuickSortCore<T>(
            this ImmutableList<T> src,
            Func<T, T, int> compare ) {
            if ( src.IsEmpty ) return src;

            var pivot = src.Head;
            var tail = src.Tail;
            return tail.Where( x => compare( x, pivot ) < 0 )
                       .QuickSortCore( compare )
                       .Concat(
                           pivot.Cons(
                               tail.Where( x => compare( x, pivot ) >= 0 )
                                   .QuickSortCore( compare ) ) );
        }
    }

    // string resources
    internal static class Strings {
        public static readonly string ListIsEmpty = "the list is empty";
    }

    // exception resources
    internal static class Errors {
        public static InvalidOperationException ListIsEmpty {
            get { return new InvalidOperationException( Strings.ListIsEmpty ); }
        }

        public static ArgumentNullException ArgumentIsNull( string paramName ) {
            return new ArgumentNullException( paramName );
        }
    }

    static class Program {
        static void Main( string[ ] args ) {
            var list = ImmutableList.Of( 3, 1, 2, 5, -1, 2, 0 );
            list = list.QuickSort( );
            foreach ( var i in list ) {
                Console.WriteLine( i );
            }
        }
    }
}

(编辑:刚看到老赵新给出的参考答案,发现我不应该用NotImplementedException的。本来我顺手敲的是UnsupportedOperationException,可是敲进VS2008发现没高亮,知道有问题了,然后再在列表里选异常类型时手滑了 T T 现改为InvalidOperationException)

对了,我在开头不是提过在QuickSort<T>上用泛型约束嘛,但还是想接近老赵提供的模板来做,所以又加了个没有约束的版本,变成现在这样。
还有一点,细心看的人肯定很快就看到了,就是我在QuickSortCore<T>()里拼接表的操作跟原本的Haskell代码不同。我的版本换回到Haskell会是类似这样:
qsort [] = []
qsort (x:xs) = qsort (filter (< x) xs) ++ (x : qsort (filter (>= x) xs))

减少了两个cons而已,没什么大不了的,效果还是一样。
(第一个cons是++ [x] ++中的[x],它是x : []的简写,有一个cons;
第二个cons是[x] ++ ...的时候,要把x拆出来再跟后面的部分concat,里面包含了一个cons)

我已经做好心理准备被拍砖了~ 来吧 =v=
在老赵的帖里,装配脑袋同学已经出现了IEnumerable<T>版的答案,如:
static Func<T, T> Fix<T>(Func<Func<T, T>, Func<T, T>> f) {
    return x => f(Fix(f))(x); 
}

var qsort = Fix<IEnumerable<int>>(f => l =>
    l.Any() ?
    f(l.Skip(1)
       .Where(e => e < l.First()))
    .Concat(Enumerable.Repeat(l.First(), 1))
    .Concat(f(l.Skip(1)
               .Where(e => e >= l.First()))) :
    Enumerable.Empty<int>());

呵呵,连Y组合子都用上了。我觉得老赵说这个不是出题的本意,是不是说他想看到的更多是表结构富有特征的地方:组装一个表得从后向前做。
另外的话,我的ImmutableList<T>虽然也实现了IEnumerable<T>,也可以用上面这段代码,但得到的结果类型就不再是原来的表,而是别的IEnumerable<T>的实现了,也有点不尽人意,毕竟原本的那段Haskell代码的返回值类型也是个表。
分享到:
评论
2 楼 RednaxelaFX 2009-09-01  
liujinmarshall 写道
Google Reader里也有备份,不用担心

师兄 T T
但是我没有用Google Reader,如果我自己要找回在那里的备份要怎么做?
再说在JavaEye发帖如果没保存原本的BBCode的话比较麻烦……WYSIWYG编辑器用得不太顺
1 楼 liujinmarshall 2009-09-01  
Google Reader里也有备份,不用担心

相关推荐

    C语言实现多种链表快速排序

    在给定的文件中,`快速排序.cpp`可能包含了具体的C语言实现代码,`qsort.h`可能是自定义的快速排序函数头文件,用于处理链表数据。`vcxproj`文件是Visual Studio项目文件,用于编译和管理源代码,而`.filters`和`....

    链表的归并排序和快速排序

    归并排序和快速排序是两种常用的排序算法,它们都可以应用于链表环境,尽管在链表上的实现与数组有所不同。下面我们将详细探讨这两种排序算法在链表上的实现细节。 ### 归并排序 (Merge Sort) **基本思想**: 归并...

    c语言链表的排序算法-排序链表最快的算法是什么?.pdf

    我们将比较不同的排序算法,包括合并排序和快速排序,并分析它们在链表中的性能。 首先,让我们讨论链表排序算法的挑战。链表的节点分布在内存中,可能会导致缓存未命中的情况,这会严重影响排序算法的性能。为了...

    归并排序,排序等算法,数据结构,快速排序,链表排序

    本主题将深入探讨四种常见的排序算法:归并排序、快速排序以及与链表相关的排序方法。 首先,我们来讨论归并排序(Merge Sort)。这是一种基于分治策略的排序算法。归并排序将大问题分解为小问题,然后逐步合并这些...

    整数链表

    在编程中,链表通常被用来替代数组,尤其是在处理动态数据或需要高效插入和删除操作时。以下是对整数链表的详细阐述: ### 1. 链表的概念 链表是一种线性数据结构,与数组不同,它不连续存储元素。每个链表节点包含...

    链表快速排序

    能够将用户给定的值生成一个随机数组然后进行排序,递归实现

    对链表进行快速排序 选择排序

    对链表进行相应操作 链表为双向链表 其中的操作有 快速排序 选择排序 插入 删除链表 从链表中获取一个数等等 程序并没有测试周全 欢迎下载 若发现问题希望在我CSDN留言 以便及时更改

    C语言链表排序

    5. 排序链表:实现冒泡排序或快速排序算法,对链表进行排序。 6. 文件操作:可能包含读取数据到链表或保存链表到文件的函数,以方便数据的持久化。 学习这段代码,初学者可以深入理解C语言中的指针操作、动态内存...

    动态链表的建立及排序

    4. **排序链表**:对于链表排序,可以使用各种算法,如插入排序、归并排序、快速排序等。由于链表的特性,插入排序在某些情况下可能更为适合,因为它只需要尾部插入操作,而无需频繁移动元素。插入排序算法步骤如下...

    data_sort.rar_VC 链表_链表排序

    - **快速排序**:基于分治策略,选取一个基准元素,将链表分为小于基准和大于基准的两部分,然后对这两部分递归地进行快速排序。 - **插入排序**:对于链表,可以在遍历过程中,将新元素按照大小插入到正确位置,...

    实现一个模板类的链表(c++)

    1. 请创建一个数据类型为T的链表类模板List,实现以下成员函数: 1) 默认构造函数List(),将该链表初始化为一个空链表(10分) 2) 拷贝构造函数List(const List&lt;T&gt;& list),根据一个给定的链表构造当前链表(10...

    c++数据结构实验链表排序.doc

    1. 排序算法:本实验要求学生实现多种排序算法,包括插入排序、冒泡排序、快速排序、简单项选择排序和堆排序,并对这些算法进行比拟和分析。 2. 链表数据结构:实验中使用链表来存储数据,链表是一种常用的数据结构...

    链表经典编程题.zip

    4. 合并链表:两个已排序的单链表可以合并为一个新的已排序链表。这通常通过比较两个链表的头节点数据,将较小的一方设为新链表的头节点,然后继续比较其余节点,直至其中一个链表为空。 5. 链表排序:对链表进行...

    数据结构链表排序数据结构课设,链表排序,升序,逆序,倒置

    在IT领域,数据结构是计算机科学的基础之一,它研究如何高效地存储和处理数据。链表作为其中一种基本的数据结构,对于理解和实现各种算法至...通过这个课设,你可以深入探究链表内部工作机制,锻炼逻辑思维和编程技巧。

    使用双向链表实现快速排序,C语言

    使用双向链表实现快速排序,C语言,有详细注释

    链表的智能排序与索引算法.pptx

    - **递归调用**:对每个块进行快速排序,并递归调用,直至整个链表排序完成。 **1.1.3 归并排序** - **归并排序原理**: - 将链表拆分为两个子链表,重复此过程直到每个子链表只包含一个节点。 - 合并两个有序子...

    利用双向循环链表实现快速排序算法

    利用了双向循环链表实现了快速排序算法

    链表的简单排序

    1. 创建链表:使用 `creat()` 函数创建链表,并读取输入数据。 2. 对链表进行排序:使用 `play()` 函数对链表进行排序。 3. 输出链表信息:使用 `out()` 函数输出链表中的信息。 链表的简单排序算法的时间复杂度是 ...

    c语言链表的基本操作整理

    2.初始化链表:initialize 函数创建一个头节点,并初始化其指针为 NULL。 3.插入节点:insert 函数在链表末尾插入一个新节点。 4.删除节点:delete 函数从链表中删除包含指定值的节点。 5.遍历链表:traverse 函数...

    基于双向链表的快速排序c程序

    用c编写的基于双向链表的快速排序。在DEVC++下和codeblock下编译通过。

Global site tag (gtag.js) - Google Analytics