`
comeonbabye
  • 浏览: 442024 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

MurmurHash算法:高运算性能,低碰撞率的hash算法

阅读更多
MurmurHash算法:高运算性能,低碰撞率,由Austin Appleby创建于2008年,现已应用到Hadoop、libstdc++、nginx、libmemcached等开源系统。2011年Appleby被Google雇佣,随后Google推出其变种的CityHash算法。

官方网站:https://sites.google.com/site/murmurhash/

MurmurHash算法,自称超级快的hash算法,是FNV的4-5倍。官方数据如下:

OneAtATime – 354.163715 mb/sec
FNV – 443.668038 mb/sec
SuperFastHash – 985.335173 mb/sec
lookup3 – 988.080652 mb/sec
MurmurHash 1.0 – 1363.293480 mb/sec
MurmurHash 2.0 – 2056.885653 mb/sec

但也有文章声称,只有当key的长度大于10字节的时候,MurmurHash的运算速度才快于DJB。“从计算速度上来看,MurmurHash只适用于已知长度的、长度比较长的字符”。

本文首发网站那些事 | 网站点兵(转载请保留)http://www.xiuwz.com/site/open-tech-murmurhash/
分享到:
评论

相关推荐

    高运算性能,低碰撞率的hash算法MurmurHash算法.zip

    MurmurHash算法由Austin Appleby创建于2008年,现已应用到Hadoop、libstdc 、nginx、libmemcached,Redis,Memcached,Cassandra,HBase,Lucene等开源系统。2011年Appleby被Google雇佣,随后Google推出其变种的...

    murmurhash

    它的主要特点在于提供了出色的运算性能和极低的哈希碰撞率,这使得它在大数据处理和键值存储系统中扮演了重要的角色。 哈希函数是将任意长度的数据转化为固定长度输出的函数,其核心目标是使得输入数据的不同部分...

    前端开源库-murmurhash3js-revisited

    MurmurHash3是一种广泛使用的非加密哈希函数,设计时考虑了性能和低碰撞率,使其特别适合于大数据处理和键值存储。在JavaScript环境中,这样的库对于前端开发者来说尤其有价值,因为它可以在浏览器和Node.js环境中...

    hash算法相关介绍

    这种算法的优点是简单易懂,但可能会导致较高的碰撞率。 #### 2. 旋转哈希 (Rotating Hash) 旋转哈希算法通过对字符串中的每个字符进行循环左移和右移操作,再结合字符的ASCII码值来计算哈希值。其实现代码如下: ...

    Hash算法收录

    ### Hash算法收录 #### 一、Hash算法简介与应用场景 Hash算法是一种常用的数据处理技术,在计算机科学领域扮演着至关重要的角色。它通过一种特定的函数将任意长度的输入(通常称为“键”或“消息”)转换成固定...

    暴雪哈希算法全部源码

    该算法主要应用于处理字符串哈希,特别是在游戏资源管理方面,如文件命名、资源索引等场景中表现出了较高的效率和良好的性能。 #### 二、哈希算法基础知识 在深入探讨暴雪哈希算法之前,我们需要了解一些基本的...

    hash算法课件

    ### Hash算法概述与应用 #### 一、Hash算法的基本概念 Hash算法是一种广泛应用于计算机科学中的数据处理技术,尤其在数据库、信息安全以及编程语言等领域有着不可或缺的地位。它通过一种特定的函数将输入的数据...

    几种常见的hash算法1

    标题和描述提到的“几种常见的hash算法1”主要是针对哈希算法在不同应用中的使用及其特性进行的探讨。 首先,哈希算法的理论基础是单向函数,它是一种在给定输入时容易计算输出,但在给定输出时难以反推输入的函数...

    经典hash算法

    【哈希算法详解】 哈希算法,又称为散列函数,是计算机科学中的一种重要工具,主要用于快速查找、数据存储和信息安全等领域。哈希算法的基本思想是将任意长度的输入(也称为预映射,pre-image)通过特定的计算过程...

    常用哈希函数结构 数据结构

    在IT领域,特别是数据结构与算法中,哈希函数扮演着至关重要的...选择合适的哈希函数取决于具体的需求,如数据类型、预期的哈希碰撞率、性能要求等。理解这些哈希函数的内部机制对于优化数据结构和算法的性能至关重要。

    js代码-javascript自定义5位哈希值,性能很高的字符串或文件hash值函数,比md5速度快很多,重复的几率为很低,一般的应用足够,

    标题和描述中提到的是一种自定义的5位哈希值函数,它在性能上优于MD5,并且具有较低的重复率,适合一般的应用场景。 哈希函数是将任意长度的数据转化为固定长度输出的函数。在JavaScript中,实现一个自定义的哈希...

    HashMap-hash原理

    具体来说,计算出的哈希码会被进一步处理,即通过**异或(XOR)运算**将较高位的信息扩展至较低位上,从而降低碰撞的概率。 ##### 高位扩展的意义: - **减少冲突**:高位扩展可以有效减少在特定哈希表大小下可能...

    用C语言实现一个简单的哈希表(hash table)

    简单的哈希函数可能使用键的模运算,但可能导致高碰撞率。更复杂的哈希函数如DJB2或MD5可以提供更好的分布,但实现复杂度较高。 - 在这个C语言实现中,哈希函数可能是一个简单的模运算,例如`hash(key) = key % ...

    xxhash:xxHash是一种非常快速的非加密哈希算法

    2. **低冲突率**:尽管速度极快,xxHash仍能保持较低的哈希冲突概率,确保哈希表的性能。 3. **简单实现**:xxHash的代码简洁,易于理解和实现,这使得它在各种平台和语言中都有实现。 4. **可定制性**:xxHash...

    简易哈希方程

    在计算机科学中,哈希函数(Hash Function)是一种将任意大小的数据映射为固定大小输出的函数,通常这个输出被称为哈希值或散列。哈希函数在许多领域都有着广泛的应用,例如数据存储、查找、密码学等。在这个场景中...

    文件校验工具(MD5,CRC32,SHA1)

    MD5算法快速且易于实现,但其安全性较低,因为存在碰撞攻击的可能性,即不同的输入可能产生相同的哈希值。尽管如此,MD5在非安全场景下仍然被用于验证文件完整性。 CRC32(Cyclic Redundancy Check with 32 bits)...

    简单的杂凑函数

    而当处理大数据时,如文件完整性检查,可能会选择能快速计算的算法,同时要求较低的冲突率。 总的来说,杂凑函数是计算机科学中一种基础且强大的工具,它们在数据处理、存储和安全方面发挥着重要作用。了解并掌握其...

Global site tag (gtag.js) - Google Analytics