`

解决哈希(HASH)冲突的主要方法

阅读更多

虽然我们不希望发生冲突,但实际上发生冲突的可能性仍是存在的。当关键字值域远大于哈希表的长度,而且事先并不知道关键字的具体取值时。冲突就难免会发 生。另外,当关键字的实际取值大于哈希表的长度时,而且表中已装满了记录,如果插入一个新记录,不仅发生冲突,而且还会发生溢出。因此,处理冲突和溢出是 哈希技术中的两个重要问题。

1、开放定址法
 

    用开放定址法解决冲突的做法是:当冲突发生时,使用某种探查(亦称探测)技术在散列表中形成一个探查(测)序列。沿此序列逐个单元地查找,直到找到给定 的关键字,或者碰到一个开放的地址(即该地址单元为空)为止(若要插入,在探查到开放的地址,则可将待插入的新结点存人该地址单元)。查找时探查到开放的 地址则表明表中无待查的关键字,即查找失败。
注意:
①用开放定址法建立散列表时,建表前须将表中所有单元(更严格地说,是指单元中存储的关键字)置空。
②空单元的表示与具体的应用相关。
     按照形成探查序列的方法不同,可将开放定址法区分为线性探查法、线性补偿探测法、随机探测等
(1)线性探查法(Linear Probing)
该方法的基本思想是:
    将散列表T[0..m-1]看成是一个循环向量,若初始探查的地址为d(即h(key)=d),则最长的探查序列为:
        d,d+l,d+2,…,m-1,0,1,…,d-1
     即:探查时从地址d开始,首先探查T[d],然后依次探查T[d+1],…,直到T[m-1],此后又循环到T[0],T[1],…,直到探查到T[d-1]为止。
探查过程终止于三种情况:
     (1)若当前探查的单元为空,则表示查找失败(若是插入则将key写入其中);
    (2)若当前探查的单元中含有key,则查找成功,但对于插入意味着失败;
     (3)若探查到T[d-1]时仍未发现空单元也未找到key,则无论是查找还是插入均意味着失败(此时表满)。
利用开放地址法的一般形式,线性探查法的探查序列为:
        hi=(h(key)+i)%m 0≤i≤m-1 //即di=i
用线性探测法处理冲突,思路清晰,算法简单,但存在下列缺点:
① 处理溢出需另编程序。一般可另外设立一个溢出表,专门用来存放上述哈希表中放不下的记录。此溢出表最简单的结构是顺序表,查找方法可用顺序查找。
② 按上述算法建立起来的哈希表,删除工作非常困难。假如要从哈希表 HT 中删除一个记录,按理应将这个记录所在位置置为空,但我们不能这样做,而只能标上已被删除的标记,否则,将会影响以后的查找。
③ 线性探测法很容易产生堆聚现象。所谓堆聚现象,就是存入哈希表的记录在表中连成一片。按照线性探测法处理冲突,如果生成哈希地址的连续序列愈长 ( 即不同关键字值的哈希地址相邻在一起愈长 ) ,则当新的记录加入该表时,与这个序列发生冲突的可能性愈大。因此,哈希地址的较长连续序列比较短连续序列生长得快,这就意味着,一旦出现堆聚 ( 伴随着冲突 ) ,就将引起进一步的堆聚。
(2)线性补偿探测法
线性补偿探测法的基本思想是:
将线性探测的步长从 1 改为 Q ,即将上述算法中的 j = (j + 1) % m 改为: j = (j + Q) % m ,而且要求 Q 与 m 是互质的,以便能探测到哈希表中的所有单元。
【例】 PDP-11 小型计算机中的汇编程序所用的符合表,就采用此方法来解决冲突,所用表长 m = 1321 ,选用 Q = 25 。

(3)随机探测
随机探测的基本思想是:
将 线性探测的步长从常数改为随机数,即令: j = (j + RN) % m ,其中 RN 是一个随机数。在实际程序中应预先用随机数发生器产生一个随机序列,将此序列作为依次探测的步长。这样就能使不同的关键字具有不同的探测次序,从而可以避 免或减少堆聚。基于与线性探测法相同的理由,在线性补偿探测法和随机探测法中,删除一个记录后也要打上删除标记。

2、拉链法
(1)拉链法解决冲突的方法
     拉链法解决冲突的做法是:将所有关键字为同义词的结点链接在同一个单链表中。若选定的散列表长度为m,则可将散列表定义为一个由m个头指针组成的指针数 组T[0..m-1]。凡是散列地址为i的结点,均插入到以T[i]为头指针的单链表中。T中各分量的初值均应为空指针。在拉链法中,装填因子α可以大于 1,但一般均取α≤1。
【例】设有 m = 5 , H(K) = K mod 5 ,关键字值序例 5 , 21 , 17 , 9 , 15 , 36 , 41 , 24 ,按外链地址法所建立的哈希表如下图所示:
          解决哈希(HASH)冲突的主要方法
(2)拉链法的优点
与开放定址法相比,拉链法有如下几个优点:
拉链法处理冲突简单,且无堆积现象,即非同义词决不会发生冲突,因此平均查找长度较短;
②由于拉链法中各链表上的结点空间是动态申请的,故它更适合于造表前无法确定表长的情况;
③开放定址法为减少冲突,要求装填因子α较小,故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1,且结点较大时,拉链法中增加的指针域可忽略不计,因此节省空间;
④ 在用拉链法构造的散列表中,删除结点的操作易于实现。只要简单地删去链表上相应的结点即可。而对开放地址法构造的散列表,删除结点不能简单地将被删结 点的空间置为空,否则将截断在它之后填人散列表的同义词结点的查找路径。这是因为各种开放地址法中,空地址单元(即开放地址)都是查找失败的条件。因此在 用开放地址法处理冲突的散列表上执行删除操作,只能在被删结点上做删除标记,而不能真正删除结点。

(3)拉链法的缺点
     拉链法的缺点是:指针需要额外的空间,故当结点规模较小时,开放定址法较为节省空间,而若将节省的指
分享到:
评论

相关推荐

    哈希表算法 链地址法解决冲突

    在"哈希表 链地址法解决冲突"的场景中,哈希函数设计为根据学生姓名的第一个大写字母来确定哈希值。这意味着具有相同首字母的学生会被映射到同一个数组位置,这样的设计简化了冲突的处理。 链地址法是处理哈希冲突...

    C++实现的hash冲突解决算法

    如果你需要自定义哈希函数或解决冲突的方法,可以继承`std::hash`并重载相关方法,或者直接实现自己的哈希表类。 在实际应用中,选择哪种冲突解决方法取决于具体的需求,如空间效率、时间效率、负载因子等因素。在...

    哈希表相关概念、hash函数、hash冲突解决方案、代码示例

    理解哈希函数的构造方法和冲突解决策略是设计和使用哈希表的关键,这对于优化算法和提升软件性能具有重要意义。无论是在字典、集合、去重等基本数据结构的实现,还是在字符串匹配、数据压缩、拼写检查等复杂应用场景...

    【精品】链地址法解决Hash冲突

    ### 链地址法解决Hash冲突 #### 一、引言 哈希表是一种非常高效的数据结构,通过哈希函数可以快速地定位到数据所在的存储位置。然而,在实际应用中,由于哈希函数的设计和数据分布的原因,经常会出现多个不同的...

    杂凑表的设计与实现 数据结构 哈希 hash

    总的来说,这个项目要求我们理解哈希表的基本概念,设计合适的哈希函数,以及实现冲突解决策略。同时,还需要具备文件操作和简单界面设计的能力,以便展示哈希表的内容。这是一个综合性的任务,涵盖了数据结构、算法...

    用二次探测再散列法解决冲突建立哈希表并查找

    二次探测再散列法是一种解决哈希冲突的方法,当一个元素的哈希地址已经被其他元素占用时,我们不会立即跳到下一个地址,而是按照平方序列(如 1, 4, 9, ...)进行探测。在本例中,如果初始哈希地址是 `i`,冲突发生...

    链式哈希表hash

    4. **双散列法**:对于解决冲突,还可以使用第二个哈希函数来确定寻找下一个槽位的方向,这种方法称为双散列法。 总的来说,链式哈希表是一种高效的数据结构,适用于大量数据的快速存取。理解和熟练掌握哈希表的...

    哈希表设计

    在本案例中,待插入的数据共有30个名字,为了确保高效地进行查找操作,我们将采用除留余数法来构造哈希函数,并使用伪随机探测再散列方法解决冲突。 #### 二、关键概念解析 **哈希表**:一种数据结构,能够提供...

    c实现的哈希表(除留余数法、链地址法)(包含设计文档)

    在这个项目中,哈希表是用C语言实现的,采用了除留余数法作为哈希函数,并使用链地址法来解决哈希冲突。 1. **除留余数法**:这是一种简单的哈希函数设计方法。给定一个大的无符号整数键值和一个较小的哈希表大小n...

    浅谈哈希表及哈希冲突.ppt

    解决哈希冲突的方法有很多种: 1. 直接定址法:如果C为0,哈希地址就是关键字本身。这种方法适用于键值与数组下标有直接关系的情况。 2. 除余法:选择一个合适的正整数m,取Key mod m作为哈希地址。通常选择素数m...

    Hash map 哈希表

    解决冲突的方法主要有开放寻址法、链地址法和再哈希法等。 1. 开放寻址法:当发生冲突时,不是在当前位置停下,而是继续寻找下一个空的槽位,直到找到为止。这种方法要求哈希表的大小必须是质数,以避免特定的键...

    Hash函数与冲突解决办法

    《Hash表的构建和冲突解决》文档可能详细介绍了如何构建哈希表、各种哈希函数的设计思路,以及在实际编程中如何运用这些方法来有效地解决冲突。可能涉及的具体内容包括: - 哈希表的基本结构和操作(如插入、删除、...

    Marvell 交换芯片mac hash 冲突计算小工具及源码

    在这里,它是用来编译和调试mac hash冲突计算小工具的。wxWidgets是一个跨平台的GUI库,使得开发者可以使用C++编写出具有原生外观的用户界面,且在Windows、Linux和macOS等操作系统上运行。 源码中可能包含了以下几...

    如何解决hash冲突

    解决哈希冲突的方法多种多样,下面我们将深入探讨其中的四种主要策略:开放地址法、再哈希法、链地址法以及公共溢出区。 1. 开放地址法: 开放地址法的基本思想是在发生冲突时寻找下一个空的哈希地址。具体实现...

    哈希计算工具 java-hash.7z

    10. **Java中的冲突解决**: 在Java集合框架中,如HashMap,哈希冲突是通过链表或红黑树来解决的。当两个键的哈希值相同但键本身不同时,它们会被放入同一个桶中,形成链表或红黑树结构。 综上所述,`java-hash.7z` ...

    Hash-lookup.zip_hash冲突

    在“Hash-lookup.zip_hash冲突”这个主题中,我们主要探讨的是在使用哈希表进行查找时遇到的冲突问题以及解决策略。 哈希函数是哈希查找的核心,它的作用是将任意长度的关键字映射到固定大小的哈希表(也称为散列表...

    hash.rar_HASH算法_fpga hash_hash_zebra85v_哈希表Verilog

    标题中的“hash.rar_HASH算法_fpga hash_hash_zebra85v_哈希表Verilog”揭示了这个压缩包文件的主要内容,它涉及到哈希(Hash)算法在高速Field-Programmable Gate Array(FPGA)上的实现,以及与Zebra85v硬件平台和...

    哈希表的建立和查找

    总结来说,哈希表是一种高效的数据结构,通过哈希函数将数据映射到数组,而线性探查和二次探查则是解决哈希冲突的常用方法。理解并灵活运用这些概念,有助于我们设计出更优化的哈希表,提高数据处理的速度。在实际...

    hash code 一种常用的哈希算法

    哈希码(Hash Code)是一种在计算机科学中广泛使用的数据处理技术,主要应用于查找和存储。标题中的"hash code"指的是这种技术,特别是在Java中的`Hashtable`类中的应用。哈希函数是哈希码的核心,它能够将任意大小...

Global site tag (gtag.js) - Google Analytics