2007 年我写过一篇关于平行数组与CPU缓存文章,最近,我在 hash_strmap 和 gold_hash_map 中应用了这种设计思想。
hash value cache
对于一些对象,计算它们的 hash value 很昂贵,而对于另外一些对象,计算它们的 hash value 很廉价;所以,我们是否做 hash 缓存对 hash table 性能很重要。
更有意思的是,hash 缓存一般只在 hash table 的增长阶段访问(rehash),而在查找阶段,不需要访问 hash 缓存,于是,可以把 hash cache 从数据结构的结点中提取出来,放到一个分离的平行数组中。所谓平行数组,也就是:以前是访问 pNode[i].hash,现在是 pHash[i],很简单的概念。
更有意思的是,我们可以随时启用(enable)或禁用(disable) hash 缓存,在 hash_strmap 的测试中,启用它大约会使插入操作的平均性能提升一倍。具体到实现上,我们甚至不需要额外的变量来表示 hash 缓存是否启用,只需要将 pHash 设成一个特殊的值来表达它是禁用的,现在设的是整数 8 (与“不”谐音),当然需要强制类型转换pHash = (size_t*)(8)。
link array
这个仅使用在 gold_hash_map 中,因为在 hash_strmap 中,link 和 offset (指向 strpool 的偏移)一起占用 8 字节(在64位环境中刚好一个指针宽度)。
hash table 使用开地址解决 hash 冲突,这样在同一个桶(bucket) 中的所有 Node 是用一个单向链表链接起来的,传统实现是使用指针做链接,gold_hash_map 和 hash_strmap 使用数组下标做链接,这样不但可以在任何时候重新链接(比如gold_hash_map 和 hash_strmap 都支持排序,而排序打乱了数组下标,所以排序之后需要重新链接),并且,在 64 位环境中还可以节约一半的内存。
传统的做法是将 link 作为 Node 的一个成员,这样很简单也很自然,gold_hash_map 一开始就是这样实现的,然而,仔细分析我们会发现,在 hash table 的查找中,对 link 访问的概率是很低的,请看代码:
只有在桶(bucket)中得到的第一个 Node 不匹配 key 的时候,才需要访问 link,而在 hash table 中,这样的第一个 Node 不匹配 Key 的概率是相对很小的,并且把它控制得很小是一个 hashfunc 优劣的评价标准。
另一方面,虽然内存现在很白菜价,并且会继续更加白菜价,然而CPU cache仍然非常昂贵。如果link和data成员都放在Node中,CPU加载data (代码中的Elem)时也会加载link,而加载进来的link却很少会被访问到。这就是为什么要把link分出去。
将link分出去还带来了一个额外的好处:hash cache 分出去了,link 也分出去了,Node 中现在就只剩下 data 了,Node 就没有存在的必要了,Node数组就是 data 数组了!这样完全省去了专门写 iterator 的代码,直接将 iterator 定义成指针就OK了。
查找失败时
查找总有找不到的时候,当查找的 Key 不存在的时候,并且 h%nBucket 刚好打进一个不空的桶:
在上面 find_i 函数中,调用 equal 之前先判断一下 hash 缓存会更快,因为在随机情况下h1%n == h2%n 时,h1 != h2 的可能性要大得多。
并且,在这种情况下,需要遍历完整个 linked list 才能知道 Key 真的不存在,所以此时至少需要访问一次 pLink 数组。
似乎此时变得很坏!然而再仔细分析上面的条件:只有在 Key 不存在,并且并且h%nBucket刚好打进一个不空的桶!如果我们把 hash tab 的装载因子 (load factor)设得小一些,比如(0.3),这个概率就会变小,从而对 pLink 数组的访问需求也变小了。因为 link 用的是整数,所以,如果我们知道整个 hash tab 不会装太多东西,我们可以把 LinkTp 设成较小的整数类型(比如
unsigned short,16位,这样最多可以在 gold_hash_tab 中装入 65535 条记录)。从而,相同的内存空间,我们可以把装载因子调得更小,从而使得访问 pLink 数组的概率更小,并且 hash 冲突的概率也更小了。
hash_strmap 的 LinkTp 是固定的(unsigned int),无法改变,这是刻意为之,因为这种灵活性对 hash_strmap 带来的好处太小了,不值得付出那么多努力。
总结
分享到:
相关推荐
X-Cart分为gold版和Pro版这两个版本。Gold版为普通商店版,Pro为商城版。这款软件的优势是功能比较强大,由于是付费方式采用终生制的开源软件,软件的稳定性、安全性以及可扩展性较强。目前已知的能与x-cart跨平台...
python学习资源
jfinal-undertow 用于开发、部署由 jfinal 开发的 web 项目
基于Andorid的音乐播放器项目设计(国外开源)实现源码,主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者,也可作为课程设计、期末大作业。
python学习资源
python学习资源
python学习一些项目和资源
【毕业设计】java-springboot+vue家具销售平台实现源码(完整前后端+mysql+说明文档+LunW).zip
HTML+CSS+JavaScarip开发的前端网页源代码
python学习资源
【毕业设计】java-springboot-vue健身房信息管理系统源码(完整前后端+mysql+说明文档+LunW).zip
成绩管理系统C/Go。大学生期末小作业,指针实现,C语言版本(ANSI C)和Go语言版本
1_基于大数据的智能菜品个性化推荐与点餐系统的设计与实现.docx
【毕业设计】java-springboot-vue交流互动平台实现源码(完整前后端+mysql+说明文档+LunW).zip
内容概要:本文主要探讨了在高并发情况下如何设计并优化火车票秒杀系统,确保系统的高性能与稳定性。通过对比分析三种库存管理模式(下单减库存、支付减库存、预扣库存),强调了预扣库存结合本地缓存及远程Redis统一库存的优势,同时介绍了如何利用Nginx的加权轮询策略、MQ消息队列异步处理等方式降低系统压力,保障交易完整性和数据一致性,防止超卖现象。 适用人群:具有一定互联网应用开发经验的研发人员和技术管理人员。 使用场景及目标:适用于电商、票务等行业需要处理大量瞬时并发请求的业务场景。其目标在于通过合理的架构规划,实现在高峰期保持平台的稳定运行,保证用户体验的同时最大化销售额。 其他说明:文中提及的技术细节如Epoll I/O多路复用模型以及分布式系统中的容错措施等内容,对于深入理解大规模并发系统的构建有着重要指导意义。
基于 OpenCV 和 PyTorch 的深度车牌识别
【毕业设计-java】springboot-vue教学资料管理系统实现源码(完整前后端+mysql+说明文档+LunW).zip
此数据集包含有关出租车行程的详细信息,包括乘客人数、行程距离、付款类型、车费金额和行程时长。它可用于各种数据分析和机器学习应用程序,例如票价预测和乘车模式分析。
把代码放到Word中,通过开发工具——Visual Basic——插入模块,粘贴在里在,把在硅基流动中申请的API放到VBA代码中。在Word中,选择一个问题,运行这个DeepSeekV3的宏就可以实现在线问答
【毕业设计】java-springboot+vue机动车号牌管理系统实现源码(完整前后端+mysql+说明文档+LunW).zip