`
aspnetwinform
  • 浏览: 89807 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
社区版块
存档分类
最新评论

散列表(三):冲突处理的方法之开地址法(线性探测再散列的实现)

 
阅读更多

二、开地址法

基本思想:当关键码key的哈希地址H0 = hash(key)出现冲突时,以H0为基础,产生另一个哈希地址H1 ,如果H1仍然冲突,再以H0

基础,产生另一个哈希地址H2 ,…,直到找出一个不冲突的哈希地址Hi ,将相应元素存入其中。这种方法有一个通用的再散列函

数形式:


其中H0 为hash(key) ,m为表长,di称为增量序列。增量序列的取值方式不同,相应的再散列方式也不同。主要有以下四种:

线性探测再散列

二次探测再散列

伪随机探测再散列

双散列法


(一)、线性探测再散列


假设给出一组表项,它们的关键码为 Burke, Ekers, Broad, Blum, Attlee, Alton, Hecht, Ederly。采用的散列函数是:取其第一个字母在

字母表中的位置。


hash (x) = ord (x) - ord (‘A’)

这样,可得

hash (Burke) = 1hash (Ekers) = 4

hash (Broad) = 1hash (Blum) = 1

hash (Attlee) = 0hash (Hecht) = 7

hash (Alton) = 0hash (Ederly) = 4

又设散列表为HT[26],m = 26。采用线性探查法处理溢出,则上述关键码在散列表中散列位置如图所示。红色括号内的数字表示找

到空桶时的探测次数。比如轮到放置Blum 的时候,探测位置1,被占据,接着向下探测位置2还是不行,最后放置在位置3,总的探

次数是3。



堆积现象

散列地址不同的结点争夺同一个后继散列地址的现象称为堆积(Clustering),比如ALton 本来位置是0,直到探测了6次才找到合适位

置5。这将造成不是同义词的结点也处在同一个探测序列中,从而增加了探测序列长度,即增加了查找时间。若散列函数不好、或装

填因子a 过大,都会使堆积现象加剧。


下面给出具体的实现代码,大体跟前面讲过的链地址法差异不大,只是利用的结构不同,如下:


status 保存状态,有EMPTY, DELETED, ACTIVE,删除的时候只是逻辑删除,即将状态置为DELETED,当插入新的key 时,只要不

是ACTIVE 的位置都是可以放入,如果是DELETED位置,需要将原来元素先释放free掉,再插入。


common.h:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br></nobr>
#ifndef_COMMON_H_
#define_COMMON_H_

#include<unistd.h>
#include<sys/types.h>
#include<stdlib.h>
#include<stdio.h>
#include<string.h>


#defineERR_EXIT(m)\
do\
{\
perror(m);\
exit(EXIT_FAILURE);\
}\
while(0)

#endif


hash.h:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br></nobr>
#ifndef_HASH_H_
#define_HASH_H_

typedefstructhashhash_t;
typedefunsignedint(*hashfunc_t)(unsignedint,void*);

hash_t*hash_alloc(unsignedintbuckets,hashfunc_thash_func);
voidhash_free(hash_t*hash);
void*hash_lookup_entry(hash_t*hash,void*key,unsignedintkey_size);
voidhash_add_entry(hash_t*hash,void*key,unsignedintkey_size,
void*value,unsignedintvalue_size);
voidhash_free_entry(hash_t*hash,void*key,unsignedintkey_size);


#endif/*_HASH_H_*/


hash.c:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br> 20<br> 21<br> 22<br> 23<br> 24<br> 25<br> 26<br> 27<br> 28<br> 29<br> 30<br> 31<br> 32<br> 33<br> 34<br> 35<br> 36<br> 37<br> 38<br> 39<br> 40<br> 41<br> 42<br> 43<br> 44<br> 45<br> 46<br> 47<br> 48<br> 49<br> 50<br> 51<br> 52<br> 53<br> 54<br> 55<br> 56<br> 57<br> 58<br> 59<br> 60<br> 61<br> 62<br> 63<br> 64<br> 65<br> 66<br> 67<br> 68<br> 69<br> 70<br> 71<br> 72<br> 73<br> 74<br> 75<br> 76<br> 77<br> 78<br> 79<br> 80<br> 81<br> 82<br> 83<br> 84<br> 85<br> 86<br> 87<br> 88<br> 89<br> 90<br> 91<br> 92<br> 93<br> 94<br> 95<br> 96<br> 97<br> 98<br> 99<br> 100<br> 101<br> 102<br> 103<br> 104<br> 105<br> 106<br> 107<br> 108<br> 109<br> 110<br> 111<br> 112<br> 113<br> 114<br> 115<br> 116<br> 117<br> 118<br> 119<br> 120<br> 121<br> 122<br> 123<br> 124<br> 125<br> 126<br> 127<br> 128<br> 129<br> 130<br> 131<br> 132<br> 133<br> 134<br> 135<br> 136<br> 137<br> 138<br> 139<br> 140<br> 141<br> 142<br> 143<br> 144<br> 145<br> 146<br> 147<br> 148<br> 149<br> 150<br> 151<br> 152<br> 153<br> 154<br> 155<br> 156<br> 157<br></nobr>
#include"hash.h"
#include"common.h"
#include<assert.h>


typedefenumentry_status
{
EMPTY,
ACTIVE,
DELETED
}entry_status_t;

typedefstructhash_node
{
enumentry_statusstatus;
void*key;
void*value;
}hash_node_t;


structhash
{
unsignedintbuckets;
hashfunc_thash_func;
hash_node_t*nodes;
};

unsignedinthash_get_bucket(hash_t*hash,void*key);
hash_node_t*hash_get_node_by_key(hash_t*hash,void*key,unsignedintkey_size);


hash_t*hash_alloc(unsignedintbuckets,hashfunc_thash_func)
{
hash_t*hash=(hash_t*)malloc(sizeof(hash_t));
//assert(hash!=NULL);
hash->buckets=buckets;
hash->hash_func=hash_func;
intsize=buckets*sizeof(hash_node_t);
hash->nodes=(hash_node_t*)malloc(size);
memset(hash->nodes,0,size);
printf("Thehashtablehasallocate.\n");
returnhash;
}

voidhash_free(hash_t*hash)
{
unsignedintbuckets=hash->buckets;
inti;
for(i=0;i<buckets;i++)
{
if(hash->nodes[i].status!=EMPTY)
{
free(hash->nodes[i].key);
free(hash->nodes[i].value);
}
}

free(hash->nodes);

printf("Thehashtablehasfree.\n");
}

void*hash_lookup_entry(hash_t*hash,void*key,unsignedintkey_size)
{
hash_node_t*node=hash_get_node_by_key(hash,key,key_size);
if(node==NULL)
{
returnNULL;
}

returnnode->value;
}

voidhash_add_entry(hash_t*hash,void*key,unsignedintkey_size,
void*value,unsignedintvalue_size)
{
if(hash_lookup_entry(hash,key,key_size))
{
fprintf(stderr,"duplicatehashkey\n");
return;
}

unsignedintbucket=hash_get_bucket(hash,key);
unsignedinti=bucket;
//找到的位置已经有人存活,向下探测
while(hash->nodes[i].status==ACTIVE)
{
i=(i+1)%hash->buckets;
if(i==bucket)
{
//没找到,并且表满
return;
}
}

hash->nodes[i].status=ACTIVE;
if(hash->nodes[i].key)//释放原来被逻辑删除的项的内存
{
free(hash->nodes[i].key);
}
hash->nodes[i].key=malloc(key_size);
memcpy(hash->nodes[i].key,key,key_size);
if(hash->nodes[i].value)//释放原来被逻辑删除的项的内存
{
free(hash->nodes[i].value);
}
hash->nodes[i].value=malloc(value_size);
memcpy(hash->nodes[i].value,value,value_size);

}

voidhash_free_entry(hash_t*hash,void*key,unsignedintkey_size)
{
hash_node_t*node=hash_get_node_by_key(hash,key,key_size);
if(node==NULL)
return;

//逻辑删除,置标志位
node->status=DELETED;
}

unsignedinthash_get_bucket(hash_t*hash,void*key)
{
//返回哈希地址
unsignedintbucket=hash->hash_func(hash->buckets,key);
if(bucket>=hash->buckets)
{
fprintf(stderr,"badbucketlookup\n");
exit(EXIT_FAILURE);
}

returnbucket;
}

hash_node_t*hash_get_node_by_key(hash_t*hash,void*key,unsignedintkey_size)
{
unsignedintbucket=hash_get_bucket(hash,key);
unsignedinti=bucket;
while(hash->nodes[i].status!=EMPTY&&memcmp(key,hash->nodes[i].key,key_size)!=0)
{
i=(i+1)%hash->buckets;
if(i==bucket)//探测了一圈
{
//没找到,并且表满
returnNULL;
}
}
//比对正确,还得确认是否还存活
if(hash->nodes[i].status==ACTIVE)
{
return&(hash->nodes[i]);
}

//如果运行到这里,说明i为空位或已被删除

returnNULL;
}

main.c:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br> 20<br> 21<br> 22<br> 23<br> 24<br> 25<br> 26<br> 27<br> 28<br> 29<br> 30<br> 31<br> 32<br> 33<br> 34<br> 35<br> 36<br> 37<br> 38<br> 39<br> 40<br> 41<br> 42<br> 43<br> 44<br> 45<br> 46<br> 47<br> 48<br> 49<br> 50<br> 51<br> 52<br> 53<br> 54<br> 55<br> 56<br> 57<br> 58<br> 59<br> 60<br> 61<br> 62<br> 63<br> 64<br> 65<br> 66<br> 67<br> 68<br> 69<br> 70<br> 71<br> 72<br> 73<br> 74<br> 75<br> 76<br> 77<br> 78<br> 79<br> 80<br> 81<br> 82<br> 83<br> 84<br> 85<br></nobr>
#include"hash.h"
#include"common.h"

typedefstructstu
{
charsno[5];
charname[32];
intage;
}stu_t;

typedefstructstu2
{
intsno;
charname[32];
intage;
}stu2_t;


unsignedinthash_str(unsignedintbuckets,void*key)
{
char*sno=(char*)key;
unsignedintindex=0;

while(*sno)
{
index=*sno+4*index;
sno++;
}

returnindex%buckets;
}

unsignedinthash_int(unsignedintbuckets,void*key)
{
int*sno=(int*)key;
return(*sno)%buckets;
}

intmain(void)
{

stu2_tstu_arr[]=
{
{1234,"AAAA",20},
{4568,"BBBB",23},
{6729,"AAAA",19}
};

hash_t*hash=hash_alloc(256,hash_int);

intsize=sizeof(stu_arr)/sizeof(stu_arr[0]);
inti;
for(i=0;i<size;i++)
{
hash_add_entry(hash,&(stu_arr[i].sno),sizeof(stu_arr[i].sno),
&stu_arr[i],sizeof(stu_arr[i]));
}

intsno=4568;
stu2_t*s=(stu2_t*)hash_lookup_entry(hash,&sno,sizeof(sno));
if(s)
{
printf("%d%s%d\n",s->sno,s->name,s->age);
}
else
{
printf("notfound\n");
}

sno=1234;
hash_free_entry(hash,&sno,sizeof(sno));
s=(stu2_t*)hash_lookup_entry(hash,&sno,sizeof(sno));
if(s)
{
printf("%d%s%d\n",s->sno,s->name,s->age);
}
else
{
printf("notfound\n");
}

hash_free(hash);

return0;
}

simba@ubuntu:~/Documents/code/struct_algorithm/search/hash_table/linear_probing$ ./main
The hash table has allocate.
4568 BBBB 23
not found
The hash table has free.


链地址法示例还有一点不同,就是key 使用的是int 类型,所以必须再实现一个hash_int 哈希函数,根据key 产生哈希地址。


分享到:
评论

相关推荐

    散列表 (哈希表,线性探测再散列)

    该实现简单直观地展示了散列表的基本原理及应用,通过线性探测法有效地处理了冲突问题,实现了高效的查找与插入操作。在实际应用中,还需要考虑更多细节问题,比如哈希函数的选择、负载因子的控制等,以进一步提高散...

    选取哈西函数h(k)=k%11,用线性探测在散列方法处理冲突。是

    选取哈西函数h(k)=k%11,用线性探测在散列方法处理冲突。是在0-10的散列地址中,对关键序列(22,41,53,46,30,01,67)构造哈希表并求等概率情 况下查找成功与不成功过的平均查找长度

    线性探测法和拉链法处理散列表冲突

    对于给定的一组整数和散列函数,分别采用线性探测法和拉链法处理冲突构造散列表,并在这两种方法构建的散列表中查找整数K,比较两种方法的时间和空间性能。

    线性开型寻址散列

    线性开型寻址散列(Linear Probing Hashing)是一种常见的散列存储方法,它在处理冲突时采用线性的探测顺序。在这个数据结构中,我们首先计算元素的关键字(key)的散列值,然后在散列表中寻找对应的位置。如果该...

    散列表---算法数据结构

    - 再散列法:使用多个散列函数,当冲突发生时,使用第二个、第三个等散列函数直到找到未被占用的地址。 - 建立公共溢出区:将散列表分为两部分,一部分是主要的散列区域,另一部分是处理冲突的溢出区域。 散列表...

    hash散列表的三种实现

    本文将详细探讨三种常见的哈希表实现方法:链地址法、线性探测法和双重散列表。 1. 链地址法: 链地址法是最直观且常用的哈希表实现方式。它将哈希表定义为一个数组,每个数组元素都指向一个链表。当一个新的元素...

    Hash表存储数据,用再散列来解决地址冲突问题,计算平均查找长度,还可以通过Key值查找对应的value

    1. 开放地址法:当发生冲突时,采用线性探测、二次探测或双哈希等方法寻找下一个空闲的位置。例如,线性探测就是顺序检查下一个位置,直到找到空位或者遍历完整个表。 2. 链地址法:在每个数组元素位置上附加一个...

    数据结构实验报告--姓名哈希表的设计与实现.doc

    设计思想:哈希函数用除留余数法构造,用线性探测再散列处理冲突。 设人名为中国人姓名的汉语拼音的形式,有30个待入的人名,取平均查找长度的上限为2。 哈希表函数用除留余数法构造,用伪随机探测再散列法处理...

    哈希函数的应用(数据结构课程设计)

    在设计该系统时,我们使用了除留余数法构造哈希函数,然后使用线性探测再散列解决冲突。系统的实现语言为C++,运行环境为Windows XP Professional。 哈希函数是一种非常有用的数据结构技术,广泛应用于各种领域。...

    数据结构散列表.ppt

    1. 开放地址法:当发生冲突时,寻找下一个空的散列地址,常见的有线性探测再散列、二次探测再散列和双哈希法等。 2. 链地址法:在每个散列地址上附加一个链表,所有散列到同一地址的关键码都挂在对应的链表上。 3. ...

    实验六 查找的有关操作.cpp

    1. 随机产生一组关键字,已知散列函数为H(key)=key%p(p为自定的常数),冲突处理方法为线性探测法实现散列表的建立(利用插入算法实现); 2.编写从散列表中查找一个元素的算法。

    散列表线性探查实验报告

    线性探查适合于冲突较少且散列表负载因子不高的情况,而拉链法则更适合处理任意负载因子,但需要额外的指针存储空间。两种方法各有优劣,选择哪种取决于具体的应用场景和需求。实验报告通过实际操作,加深了对这两种...

    数据结构课程设计--线性开型寻址散列表

    在这个数据结构课程设计中,我们专注于线性开放寻址法,这是一种处理哈希冲突的方法。当我们谈到“开放寻址”时,意味着当键值对在哈希表中的位置已经被占用时,我们将寻找下一个空的槽位来存储新的键值对。 在传统...

    数据结构实验C语言实现散列表-构造-解决冲突-查找.pdf

    Open Addressing是指当发生冲突时,在散列表中找到下一个可用位置的方法,如平方探测或线性探测。平方探测是冲突解决的一种策略,当一个位置被占用时,会使用(i^2)% 表长度的方式来寻找下一个空位。而线性探测则是...

    数据结构7.4散列查找技术

    1. 开放定址法:在散列表中寻找下一个空闲地址,可以是线性探测、二次探测或者双散列法。线性探测是向后寻找空闲地址,二次探测则是按照二次方的间隔寻找,双散列法使用另一个散列函数来计算探查序列。 2. 链接法:...

    实验十一 散列表实验

    `CreatHash` 负责创建散列表,通过用户输入的散列表长度和取模参数确定散列函数,并使用线性探测法处理冲突。`SearchHash` 函数查找指定的关键码并返回查找次数。在 `main` 函数中,用户可以选择新建散列表、执行...

    哈希(散列)查找1

    哈希(散列)查找是一种高效的数据检索方法,其核心思想是通过散列函数将关键码映射到一个固定大小的散列表中,以达到快速查找的目的。在散列查找中,有两个关键问题需要解决:散列函数的设计和冲突的处理。 首先,...

    散列表 课程设计

    - 开放地址法:当发生冲突时,通过线性探测、二次探测或双哈希等方法寻找下一个空位。 - 链地址法:每个数组元素是一个链表,冲突的键都存储在同一个链表中。 - 再哈希法:使用多个不同的哈希函数来解决冲突。 -...

Global site tag (gtag.js) - Google Analytics