SkipList 跳表

kenby

浏览: 728548 次
性别:
来自: 北京

最近访客更多访客>>

xiaoyu966

walson_z

abcCL6

huixia0010

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

algorithms

为什么选择跳表

目前经常使用的平衡数据结构有：B树，红黑树，AVL树，Splay Tree, Treep等。

想象一下，给你一张草稿纸，一只笔，一个编辑器，你能立即实现一颗红黑树，或者AVL树

出来吗？很难吧，这需要时间，要考虑很多细节，要参考一堆算法与数据结构之类的树，

还要参考网上的代码，相当麻烦。

用跳表吧，跳表是一种随机化的数据结构，目前开源软件 Redis 和 LevelDB 都有用到它，

它的效率和红黑树以及 AVL 树不相上下，但跳表的原理相当简单，只要你能熟练操作链表，

就能轻松实现一个 SkipList。

有序表的搜索

考虑一个有序表：

从该有序表中搜索元素 < 23, 43, 59 > ，需要比较的次数分别为 < 2, 4, 6 >，总共比较的次数

为 2 + 4 + 6 = 12 次。有没有优化的算法吗? 链表是有序的，但不能使用二分查找。类似二叉

搜索树，我们把一些节点提取出来，作为索引。得到如下结构：

这里我们把 < 14, 34, 50, 72 > 提取出来作为一级索引，这样搜索的时候就可以减少比较次数了。

我们还可以再从一级索引提取一些元素出来，作为二级索引，变成如下结构：

这里元素不多，体现不出优势，如果元素足够多，这种索引结构就能体现出优势来了。

跳表

下面的结构是就是跳表：

其中 -1 表示 INT_MIN，链表的最小值，1 表示 INT_MAX，链表的最大值。

跳表具有如下性质：

(1) 由很多层结构组成

(2) 每一层都是一个有序的链表

(3) 最底层(Level 1)的链表包含所有元素

(4) 如果一个元素出现在 Level i 的链表中，则它在 Level i 之下的链表也都会出现。

(5) 每个节点包含两个指针，一个指向同一链表中的下一个元素，一个指向下面一层的元素。

跳表的搜索

例子：查找元素 117

(1) 比较 21，比 21 大，往后面找

(2) 比较 37, 比 37大，比链表最大值小，从 37 的下面一层开始找

(3) 比较 71, 比 71 大，比链表最大值小，从 71 的下面一层开始找

(4) 比较 85，比 85 大，从后面找

(5) 比较 117，等于 117，找到了节点。

具体的搜索算法如下：

/* 如果存在 x, 返回 x 所在的节点，
 * 否则返回 x 的后继节点 */
find(x) 
{
    p = top;
    while (1) {
        while (p->next->key < x)
            p = p->next;
        if (p->down == NULL) 
            return p->next;
        p = p->down;
    }
}

跳表的插入

先确定该元素要占据的层数 K（采用丢硬币的方式，这完全是随机的）

然后在 Level 1 ... Level K 各个层的链表都插入元素。

例子：插入 119， K = 2

如果 K 大于链表的层数，则要添加新的层。

例子：插入 119， K = 4

丢硬币决定 K

插入元素的时候，元素所占有的层数完全是随机的，通过一下随机算法产生：

int random_level()
{
    K = 1;

    while (random(0,1))
        K++;

    return K;
}

相当与做一次丢硬币的实验，如果遇到正面，继续丢，遇到反面，则停止，

用实验中丢硬币的次数 K 作为元素占有的层数。显然随机变量 K 满足参数为 p = 1/2 的几何分布，

K 的期望值 E[K] = 1/p = 2. 就是说，各个元素的层数，期望值是 2 层。

跳表的高度。

n 个元素的跳表，每个元素插入的时候都要做一次实验，用来决定元素占据的层数 K，

跳表的高度等于这 n 次实验中产生的最大 K，待续。。。

跳表的空间复杂度分析

根据上面的分析，每个元素的期望高度为 2，一个大小为 n 的跳表，其节点数目的

期望值是 2n。

跳表的删除

在各个层中找到包含 x 的节点，使用标准的 delete from list 方法删除该节点。

例子：删除 71

查看图片附件

分享到：

cookie 实现验证码的原理 | Erlang 学习笔记

2011-10-09 01:08
浏览 40017
评论(6)
分类:编程语言
查看更多

6 楼 wxweven 2017-02-15

Surmounting 写道

既然 Java 的跳表那么少，我决定做一个，至少能自动扩容，实现 List 接口和 SortedSet 。
不知道有没有机会借此往 Oracle 发布一下自己的程序……

要是 Sun 没有被收购该多好啊…

真能装！！！连Java有没有跳表都不知道，就说要写一个Java版的跳表! 你要比Doug Lea还牛，至于在这水ITeye?

5 楼 jacktao219 2015-08-24

赞一个~！

，现在正在看redis 所以接触到跳表

4 楼 YorkTsai 2013-04-04

请问，您是用什么软件画图的呢？这些图片很生动耶。。

3 楼 Surmounting 2013-03-28

Surmounting 写道

后来联系了 Oracle-Java 在中国区的一个负责人。她告诉我，其实在 java.util.concurrent 包里边，有跳表。

2 楼 boyhailong 2013-03-04

总结的很好。

1 楼 Surmounting 2012-11-30

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SkipList 跳表

为什么选择跳表

有序表的搜索

跳表

跳表的搜索

跳表的插入

丢硬币决定 K

跳表的高度。

跳表的空间复杂度分析

跳表的删除

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SkipList 跳表

为什么选择跳表

有序表的搜索

跳表

跳表的搜索

跳表的插入

丢硬币决定 K

跳表的高度。

跳表的空间复杂度分析

跳表的删除

评论

发表评论

相关推荐

Paxos算法

编程之美3.3 计算字符串的相似度

编程之美3.1 字符串移位包含的问题

(转)一致性哈希算法及其在分布式系统中的应用

算法导论习题 5.1 -2

现在有一个整数数组，已知一个数出现的次数超过了一半，请用O(n)的复杂度的算法找出这个数

从海量数据中找中位数（c语言实现）

寻找最大的K个数 (C语言实现)

kmp算法的理解与实现

败者树 多路平衡归并外部排序

实现两个整数的除法，不能用除号和乘号

最大公共子字符串(Longest Common Substring)

poj 1458 最长公共子串(Longest Common Subsequence)

归并排序

快速排序 顺序统计量 数组分割

位运算集锦

最长递增子序列

poj 2774 后缀数组

poj 2823 线段树

poj 3368 RMQ 线段树 离散化

最近访客更多访客>>

败者树多路平衡归并外部排序

快速排序顺序统计量数组分割

poj 3368 RMQ 线段树离散化