`
zhaohaolin
  • 浏览: 1011260 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

打造最快的Hash表(和Blizzard的对话)[转]

阅读更多

開元最近学习了一下Blizzard的MPQ文件格式,颇有一些心得,其中一条就是对HastTable的理解,很想写出来给大家共享,感谢Justin Olbrantz的文章《Inside MoPaQ》,大多认识来源于此。

 

先提一个简单的问题,如果有一个庞大的字符串数组,然后给你一个单独的字符串,让你从这个数组中查找是否有这个字符串并找到它,你会怎么做?

有一个方法最简单,老老实实从头查到尾,一个一个比较,直到找到为止,我想只要学过程序设计的人都能把这样一个程序作出来,但要是有程序员把这样的程序交给用户,我只能用无语来评价,或许它真的能工作,但...也只能如此了。

最合适的算法自然是使用HashTable(哈希表),先介绍介绍其中的基本知识,所谓Hash,一般是一个整数,通过某种算法,可以把一个字符串"压缩" 成一个整数,这个数称为Hash,当然,无论如何,一个32位整数是无法对应回一个字符串的,但在程序中,两个字符串计算出的Hash值相等的可能非常小,下面看看在MPQ中的Hash算法

unsigned long HashString(char *lpszFileName, unsigned long dwHashType)

 unsigned char *key = (unsigned char *)lpszFileName;
unsigned long seed1 = 0x7FED7FED, seed2 = 0xEEEEEEEE;
int ch;

while(*key != 0)

  ch = toupper(*key++);

seed1 = cryptTable[(dwHashType << 8) + ch] ^ (seed1 + seed2);
seed2 = ch + seed1 + seed2 + (seed2 << 5) + 3; 
 }
return seed1; 

Blizzard的这个算法是非常高效的,被称为"One-Way Hash",举个例子,字符串"unitneutralacritter.grp"通过这个算法得到的结果是0xA26067F3。
是不是把第一个算法改进一下,改成逐个比较字符串的Hash值就可以了呢,答案是,远远不够,要想得到最快的算法,就不能进行逐个的比较,通常是构造一个哈希表(Hash Table)来解决问题,哈希表是一个大数组,这个数组的容量根据程序的要求来定义,例如1024,每一个Hash值通过取模运算 (mod)对应到数组中的一个位置,这样,只要比较这个字符串的哈希值对应的位置又没有被占用,就可以得到最后的结果了,想想这是什么速度?是的,是最快的O(1),现在仔细看看这个算法吧
int GetHashTablePos(char *lpszString, SOMESTRUCTURE *lpTable, int nTableSize)

 int nHash = HashString(lpszString), nHashPos = nHash % nTableSize;

if (lpTable[nHashPos].bExists && !strcmp(lpTable[nHashPos].pString, lpszString)) 
  return nHashPos; 
 else 
  return -1; //Error value 

看到此,我想大家都在想一个很严重的问题:"如果两个字符串在哈希表中对应的位置相同怎么办?",毕竟一个数组容量是有限的,这种可能性很大。解决该问题的方法很多,我首先想到的就是用"链表",感谢大学里学的数据结构教会了这个百试百灵的法宝,我遇到的很多算法都可以转化成链表来解决,只要在哈希表的每个入口挂一个链表,保存所有对应的字符串就OK了。

事情到此似乎有了完美的结局,如果是把问题独自交给我解决,此时我可能就要开始定义数据结构然后写代码了。然而Blizzard的程序员使用的方法则是更精妙的方法。基本原理就是:他们在哈希表中不是用一个哈希值而是用三个哈希值来校验字符串。

中国有句古话"再一再二不能再三再四",看来Blizzard也深得此话的精髓,如果说两个不同的字符串经过一个哈希算法得到的入口点一致有可能,但用三个不同的哈希算法算出的入口点都一致,那几乎可以肯定是不可能的事了,这个几率是1:18889465931478580854784,大概是10的 22.3次方分之一,对一个游戏程序来说足够安全了。

现在再回到数据结构上,Blizzard使用的哈希表没有使用链表,而采用"顺延"的方式来解决问题,看看这个算法:
int GetHashTablePos(char *lpszString, MPQHASHTABLE *lpTable, int nTableSize)

 const int HASH_OFFSET = 0, HASH_A = 1, HASH_B = 2;
int nHash = HashString(lpszString, HASH_OFFSET);
int nHashA = HashString(lpszString, HASH_A);
int nHashB = HashString(lpszString, HASH_B);
int nHashStart = nHash % nTableSize, nHashPos = nHashStart;

while (lpTable[nHashPos].bExists)

  if (lpTable[nHashPos].nHashA == nHashA && lpTable[nHashPos].nHashB == nHashB) 
   return nHashPos; 
  else 
   nHashPos = (nHashPos + 1) % nTableSize;
  
  if (nHashPos == nHashStart) 
   break; 
 }

return -1; //Error value 

1. 计算出字符串的三个哈希值(一个用来确定位置,另外两个用来校验)
2. 察看哈希表中的这个位置
3. 哈希表中这个位置为空吗?如果为空,则肯定该字符串不存在,返回
4. 如果存在,则检查其他两个哈希值是否也匹配,如果匹配,则表示找到了该字符串,返回
5. 移到下一个位置,如果已经越界,则表示没有找到,返回
6. 看看是不是又回到了原来的位置,如果是,则返回没找到
7. 回到3

怎么样,很简单的算法吧,但确实是天才的idea, 其实最优秀的算法往往是简单有效的算法,
Blizzard被称为最卓越的游戏制作公司,不愧于此。

http://blog.blogchina.com/article_85296.361466.html
同时参看:http://www.googlechinablog.com/atom.xml
数学之美系列二十一 - 布隆过滤器(Bloom Filter)

分享到:
评论

相关推荐

    高手打造最快的Hash表源码(和Blizzard的对话)

    在《高手打造最快的Hash表源码(和Blizzard的对话)》这个主题中,我们可以期待深入探讨这些细节,学习如何在实际项目中优化Hash表的性能,以满足像Blizzard这样的顶级游戏公司的需求。这份源码可能会包含独特的设计...

    打造最快的Hash表(和Blizzard的对话)

    ### 打造最快的Hash表(和Blizzard的对话) #### Hash表基础知识与应用场景 本文将深入探讨如何构建高效的Hash表,并特别关注Blizzard在游戏开发过程中所采用的技术。Hash表是一种利用散列函数来实现快速查找的数据...

    blizzard_hash.rar_Blizzard hash_blizzard_哈希算法_暴雪 哈希 算法_暴雪hash

    暴雪哈希(Blizzard Hash)算法是一种由暴雪娱乐公司设计的独特哈希函数,它在计算机科学领域,特别是信息安全和数据处理中占有重要地位。这个算法因其高效性和优秀的抗冲突性能而备受赞誉。哈希算法是将任意长度的...

    Blizzard的哈希算法

    为了实现这一点,Blizzard采用了哈希表(Hash Table)的概念。哈希表本质上是一个数组,其大小根据程序需求设定,比如可以设置为1024。每个哈希值通过取模运算(mod)与数组中的一个位置对应起来,这样只需检查该...

    Blizzard_Vc_blizzard_源码

    《VC++实现暴风雪效果:Blizzard_Vc_blizzard_源码解析》 在计算机图形学的世界里,模拟自然现象是一种挑战,同时也是一种艺术。Blizzard_Vc_blizzard 源码提供了一种使用 VC++ 实现暴风雪效果的方法,这对于游戏...

    C++小游戏 Blizzard (VisualCPP代码作业)

    C++小游戏 Blizzard (VisualCPP代码作业)C++小游戏 Blizzard (VisualCPP代码作业)C++小游戏 Blizzard (VisualCPP代码作业)C++小游戏 Blizzard (VisualCPP代码作业)C++小游戏 Blizzard (VisualCPP代码作业)C++小游戏 ...

    Blizzard github下载地图是星际争霸的地图

    在"Blizzard github下载地图是星际争霸的地图"这个主题中,我们主要关注的是如何利用Python编程语言和AI技术来让计算机在游戏中进行智能决策,与玩家或者机器进行对战。 首先,"s2client-proto-master"这个文件名...

    KeepTool.v6.1.1.2.Incl.Keygen-BLiZZARD

    比 PL.SQL.Developer.v5.1.6.747 好注册机

    Blizzard 1.2_rat_Only_Remoteadministrator_

    Blizzard rat 1.2 for windows only

    改进的BlizzardUI:对Blizzard UI的常规改进

    《改进的BlizzardUI:对Blizzard UI的常规改进》 BlizzardUI是暴雪娱乐在旗下游戏,如《魔兽世界》(World of Warcraft, WoW)中提供的用户界面(User Interface, UI)框架,它为玩家提供了与游戏互动的基础。然而,...

    blzd-frontend:Blizzard.money:snowflake:的前端

    "blzd-frontend:Blizzard.money:snowflake:的前端" 这个项目是暴雪娱乐公司(Blizzard Entertainment)的一个前端开发框架,主要用于构建其内部应用或服务。"snowflake"在这里可能指的是一个特定的模块或者命名约定...

    Veritas Backup Exec v9.0 by Blizzard 算号器

    Veritas Backup Exec v9.0 by Blizzard 算号器

    Blizzard:另一个国际象棋引擎-这次是C语言!

    "暴风雪"(Blizzard)是一个用C语言编写的国际象棋引擎,它以其高效、精简的代码结构展现了C语言的强大功能。这篇文章将深入探讨暴风雪引擎的设计原理、实现技术以及其与Heatwave的关系。 首先,我们来理解一下国际...

    Api-blizzard.js.zip

    Api-blizzard.js.zip,暴雪战网社区平台apiblizzard.js的基于promise的node.js库,一个api可以被认为是多个软件设备之间通信的指导手册。例如,api可用于web应用程序之间的数据库通信。通过提取实现并将数据放弃到对象...

    seo-for-wordpress-blogs-blizzard-internet-marketing

    标题和描述提到的文章是关于WordPress博客的SEO策略,它强调了WordPress在搜索引擎优化(SEO)方面的优势以及如何使用该平台和特定插件以提高搜索引擎结果页面(SERP)的排名。WordPress因其SEO功能而受到SEO专家们...

    DigiDNA.DiskAid.v4.6.2.Incl.Keygen-BLiZZARD

    《DigiDNA DiskAid v4.6.2 Incl Keygen-BLiZZARD》是一款由DigiDNA公司开发的高效工具,专为苹果设备如iPhone和iPod提供数据管理和传输服务。这款软件的发布日期为2011年5月5日,它在当时为用户提供了将iOS设备作为...

    blizzard_hash_for_android:降低暴雪哈希的内存消耗(理论上牺牲碰撞率),千万量级别以内的数据,碰撞率和内存消耗都优与bloom filter

    blizzard_hash_for_android降低暴雪哈希的内存消耗(理论上牺牲碰撞率),千万量级别以内的数据,碰撞率和内存消耗都优与bloom filternode 结点存放两个属性:1)nHashA, nHashA取byte的前7位(1~127),用以存储Hash...

    Blizzard-Test-Cases:包含用于测试 Blizzard Item API 和 Item Set API 的驱动程序和测试用例

    "Blizzard-Test-Cases" 是一个专门针对暴雪Item API和Item Set API设计的测试框架,旨在确保这两个API的稳定性和可靠性。下面我们将详细探讨这个测试套件的核心内容和应用。 1. **Blizzard Item API**:暴雪Item ...

    blizzard:HTTP唯一ID生成服务

    暴风雪 作为Ring中间件提供的Flake ID生成服务。... 在独立或中间件用例中,Ring应用程序都将提供/ flake和/ flake /:n这两个路由,分别生成一个薄片和N个薄片。 消费者 请注意,暴风雪会产生以编码的响应。

    blizzard.js:暴雪Battle.net社区平台API的基于承诺的Node.JS库

    Blizzard.js Blizzard.js是... 暗黑破坏神3 : d3 炉石: hs 星际争霸2 : sc2 魔兽世界(零售) : wow 魔兽世界(经典) : wow.classic 带有TypeScript和ES模块import { wow } from 'blizzard.js'const wowClient =

Global site tag (gtag.js) - Google Analytics