hash函数学习总结，以及与hashcode()、hashMap的关系

loveofgod

浏览: 754404 次
性别:
来自: 北京

最近访客更多访客>>

u012363178

piggysnoopy

落林是尘啊

dev灰色天空

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

算法

算法数据结构面试编程 C#

以前一直觉得hash函数很深奥，上王珊的《数据库实现原理》的时候，似乎明白了一点点，但是到学java
的时候，频繁接触到hashcode()，hashMap这些，就总在想这三者之间有关系吗？hash函数是什么？hashcode()，
hashMap和hash函数又有什么关系呢？

今天终于对这个问题有了初步的学习和理解：

1.什么是hash函数：
1）来自：http://beyond911.bokee.com/1047973.html

什么是HASH函数(经典例子)

让我们先来了解一些基本知识，作作预热只有这样才能更好的了解hash。

Hash，一般翻译做"散列"，也有直接音译为"哈希"的，就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。

简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。

HASH主要用于信息安全领域中加密算法，他把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说，hash就是找到一种数据内容和数据存放地址之间的映射关系

2）来自：http://www.hour41.com/blog/hour41/entry/200701255
计算理论中，没有Hash函数的说法，只有单向函数的说法。所谓的单向函数，是一个复杂的定义，大家可以去看计算理论或者密码学方面的数据。用“人类”的语言描述单向函数就是：如果某个函数在给定输入的时候，很容易计算出其结果来；而当给定结果的时候，很难计算出输入来，这就是单项函数。各种加密函数都可以被认为是单向函数的逼近。Hash函数（或者成为散列函数）也可以看成是单向函数的一个逼近。即它接近于满足单向函数的定义。

Hash函数还有另外的含义。实际中的Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间，使得数据容易保存。除此以外，Hash函数往往应用于查找上。所以，在考虑使用Hash函数之前，需要明白它的几个限制：

1. Hash的主要原理就是把大范围映射到小范围；所以，你输入的实际值的个数必须和小范围相当或者比它更小。不然冲突就会很多。
2. 由于Hash逼近单向函数；所以，你可以用它来对数据进行加密。
3. 不同的应用对Hash函数有着不同的要求；比如，用于加密的Hash函数主要考虑它和单项函数的差距，而用于查找的Hash函数主要考虑它映射到小范围的冲突率。

3）自己的总结：
   a）hash函数就是把任意长度的输入（又叫做预映射， pre-image），通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，而不可能从散列值来唯一的确定输入值。
例如，散列算法为求余的hash函数。
   b）实际中的Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间，使得数据容易保存。
   c）在数据结构中，hash就是找到一种数据内容和数据存放地址之间的映射关系，比如，31对10求余后得1，就把31存放到第一个桶里（或者是第一块内存单元中），即把数据和存放地址建立映射关系；
   d）所以，有了数据内容和数据存放地址之间的映射关系，Hash函数往往应用于查找上。不过，利用hash函数的查找跟以前自己理解的不同，以前自己以为是通过hash函数就能立即找到存储地址，就像HashMap中根据key立即能找到value一样，其实不是这样的，hash函数只不过是根据散列算法和解决冲突的方法来提供一种定位和查找的方式，hashmap中根据可以马上找到value值是理所当然的，但是根据hash函数找到key值就不是立即的了。当然，为了方便查找，尽量使得hash函数无冲突，可以唯一确定地址是最理想的。娃哈哈，终于弄清楚这一点了！
   e）Hash函数是指把一个大范围映射到一个小范围，所以hash函数是求余之类的压缩函数，（比如，11，13的范围压缩为1，3），而不是10x＋7这样的扩散函数，（比如，11，13的范围扩散为117，137）；
   f）由于Hash逼近单向函数；所以，你可以用它来对数据进行加密。
   g）不同的应用对Hash函数有着不同的要求；比如，用于加密的Hash函数主要考虑它和单项函数的差距，而用于查找的Hash函数主要考虑它映射到小范围的冲突率。

2.散列表相关知识的系统学习：
数据结构自考网：http://student.zjzk.cn/course_ware/data_structure/web/chazhao/chazhao9.4.1.htm

3. JDK中HashMap的分析
1）来自：http://chinakite.iteye.com/blog/25073
2）请问hashtable类里面的hash函数是怎么样的？
来自：http://topic.csdn.net/t/20020311/09/567386.html

他是调用每个类自己本身的hashCode的方法来确定的
public   synchronized   Object   put(Object   key,   Object   value)   {
...
int   hash   =   key.hashCode();//就是这里了
int   index   =   (hash   &   0x7FFFFFFF)   %   tab.length;
...
          }
详细请看java的源文件

String的散列值是由内容转换来的，Object类的却省散列函数返回对象地址转换来的散列值。

4.面试题：
来自：http://www.javaref.cn/topics/Question/10566.html

问题：

a)请问哈希表 (hashtable) 是如何存储数据的？

答案： Hashtable 是用来存储 key 和 value 对的数据结构 , 根据设定的 hash 函数 H(key) 和处理冲突的方法将一组关键字（ key ）映象到一个有限的连续的地址集（区间）上，并以关键字在地址集中的“象”作为记录在表中存储位置，这种表便成为 hashtable.

b)是否两个键值通过 hash 函数产生的映射地址会一样？怎么办？

答案 : 是，一般情况下，完全避免冲突是很难的。因为通常关键字集合会比目标地址空间大。哈希函数要尽量避免冲突（避免不同的关键字产生相同的 hash 值），使一组关键字的哈西地址尽可能的均匀分布在整个地址区间。所以有一些冲突处理方法：开放定址法，再哈希法，链地址法（用链表保存冲突的值），公共溢出区。

关于哈希表，有个与实际编程更密切的问题可以一问：为保证逻辑上的正确性，哈希表对可以作为键值的类型有什么要求？ C++：除容器对元素类型的标准需求外，还需overload == 和 < Java：需override equals(逻辑上的正确性)和hashCode(性能) C#：需override Equals(逻辑上的正确性)和HashCode(性能)

分享到：

【风雪】回家路 | MS，Google，VMWare，Nvidia 美国总部招聘 ...

2008-02-10 06:21
浏览 7510
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

中国人工智能产业发展联盟金融大模型落地路线图研究报告2024年56页.pdf: 中国人工智能产业发展联盟金融大模型落地路线图研究报告2024年56页.pdf

USB运动控制开源系统揭秘：五轴雕刻机核心技术全开源，支持RTCP算法，PCB生产便捷，C++源码可复制,USB运动控制五轴雕刻机系统完全开源资料，含PCB生产支持及多版本C++源码,USB运动控制: USB运动控制开源系统揭秘：五轴雕刻机核心技术全开源，支持RTCP算法，PCB生产便捷，C++源码可复制,USB运动控制五轴雕刻机系统完全开源资料，含PCB生产支持及多版本C++源码,USB运动控制 (五轴雕刻机系统)全部开源不保留任何关键技术，PCB可直接生产，C++6.0源码，从13.7-18.2所有版本，本产品为可复制资料，支持五轴联动，支持RTCP算法，全部开源。 1、为电子资料 2、PCB底板+原理图+源码 ,核心关键词：USB运动控制; 五轴雕刻机系统; 开源技术; 不保留关键技术; C++6.0源码; 版本范围(13.7-18.2); 可复制资料; 五轴联动; RTCP算法; PCB底板; 原理图。,开源五轴雕刻机系统：USB运动控制全解析

Java-springboot+vue高校党务学习信息系统毕业设计源码.zip: 系统选用B/S模式，后端应用springboot框架，前端应用vue框架， MySQL为后台数据库。本系统基于java设计的各项功能，数据库服务器端采用了Mysql作为后台数据库，使Web与数据库紧密联系起来。在设计过程中，充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。

基于16QAM的SIMULINK与MATLAB联合仿真系统：调制解调波形分析与应用拓展,基于MATLAB和SIMULINK平台的16QAM调制与解调仿真研究及波形分析,16QAM SIMULINK 基: 基于16QAM的SIMULINK与MATLAB联合仿真系统：调制解调波形分析与应用拓展,基于MATLAB和SIMULINK平台的16QAM调制与解调仿真研究及波形分析,16QAM SIMULINK 基于SIMULINK和MATLAB的16QAM调制和解调。采用SIMULINK搭建框图，MATLAB调用模型得出波形图。（可自行简单修改在SIMULINK中加scope，无须MATLAB调用） ,核心关键词： 16QAM; SIMULINK; MATLAB; 调制; 解调; 波形图; 框图; Scope,基于SIMULINK的16QAM调制解调系统研究

基于PMSM模型的四种控制策略对比研究：传统滑膜控制与扰动观测器的优化与应用,基于滑膜控制扰动观测器的PMSM模型：四控制策略对比分析与实践应用研究 [附带视频与出图程序],基于滑膜控制扰动观测器的永: 基于PMSM模型的四种控制策略对比研究：传统滑膜控制与扰动观测器的优化与应用,基于滑膜控制扰动观测器的PMSM模型：四控制策略对比分析与实践应用研究 [附带视频与出图程序],基于滑膜控制扰动观测器的永磁同步电机PMSM模型四个控制对比： 1、PID控制器 2、传统滑模控制器 3、最优滑模控制器 4、改进补偿滑膜控制器 [1]附带简单讲解视频如下图 [2]附带出图程序，四个控制对比的说明文档（2篇，非次品） ,核心关键词：滑膜控制; 扰动观测器; 永磁同步电机PMSM模型; PID控制器; 传统滑模控制器; 最优滑模控制器; 改进补偿滑膜控制器; 简单讲解视频; 出图程序; 对比说明文档。,PMSM模型下的滑膜控制：四法比拼，解析与可视化

Abaqus USDFLD子程序：实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序：实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序实现积分点间: Abaqus USDFLD子程序：实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序：实现积分点间材料弹性连续变化仿真的高效方法,Abaqus USDFLD子程序实现积分点间材料弹性连续变化仿真 ,Abaqus; USDFLD子程序; 积分点; 材料弹性; 连续变化仿真;,Abaqus USDFLD实现材料弹性连续变化仿真

早中期数字信号处理复习指南：概念、分析与应用: 内容概要：本文档为《早中期复习—数字信号处理》的学习指南，详细介绍了数字信号处理的相关概念和方法，旨在梳理并巩固相关领域的知识点。文档内容涵盖数字信号处理基本概念及时域离散信号和系统的分析方法；重点探讨时域离散信号、离散傅里叶变换及其快速算法（FFT）；详细介绍了基于离散信号变换方法的不同类型滤波器的设计；此外还列举了部分经典的面试题目及其解答方向，以辅助备考者准备面试。文档有助于深入理解和掌握这一学科，提高对信号分析技能的认知和应用。适合人群：本指南主要面向正在备战考试或从事相关工作的初学者，尤其是需要系统性复习并加强理论理解和实际操作技巧的学生和工程师。使用场景及目标：可用于准备研究生入学面试或者作为工程师日常工作中处理复杂工程问题时的参考手册。目标是帮助使用者加深对数字信号处理的认识，掌握关键技术和应用场景，以便更好地应对学术和工业挑战。其他说明：文档结构清晰、条理性强，配合大量例题和图示，有利于读者理解和记忆。同时，提供了实用的小贴士和思考题，引导读者积极思考，拓展视野，培养独立解决问题的能力。

模拟浏览器操作程序-总文件压缩包（代码+所有磁盘文件）: 题目2.5（模拟浏览器操作程序）：标准Web浏览器具有在最近访问的网页间后退和前进的功能。实现这些功能的个方法是：使用两个栈，追踪可以后退和前进而能够到达的网页。

SensorTower2024年AI应用市场洞察报告31页.pdf: SensorTower2024年AI应用市场洞察报告31页.pdf

chromedriver-win32-136.0.7055.0.zip: chromedriver-win32-136.0.7055.0.zip

COMSOL热流耦合拓扑优化：最大化放热量与功率耗散策略解析,Comsol热流耦合拓扑优化技术：以最大化放热量与功率耗散为目标函数的优化策略,Comsol热流耦合拓扑优化目标函数采用最大化放热量和: COMSOL热流耦合拓扑优化：最大化放热量与功率耗散策略解析,Comsol热流耦合拓扑优化技术：以最大化放热量与功率耗散为目标函数的优化策略,Comsol热流耦合拓扑优化。目标函数采用最大化放热量和功率耗散。 ,Comsol;热流耦合;拓扑优化;目标函数;最大化放热量;功率耗散,Comsol热流耦合优化：最大化放热与功率耗散

机器人辅助假肢测试中的实时混合子结构仿真：机械臂选型与集成: 内容概要：本文介绍了将假肢测试与实时混合子结构（RTHS）方法相结合的技术背景。RTHS方法用于将完整的动态系统分解为数值部分（numerical part）和实验部分（experimental part），并在Simulink中进行建模。数值部分包括模拟截肢者的模型，而实验部分则涉及真实的机械臂和假肢。两者通过传输系统耦合，实现了步行阶段的动态交互。文章具体描述了不同步态阶段的动力学模拟流程，包括飞行阶段（抬脚离地）和接触阶段（脚触地）。为了实现有效的仿线，提出了对机械臂的四个关键要求：能够执行接口运动、承受界面力、低延迟高精度以及实现实时通信。适合人群：从事生物力学、医疗器械和机器人技术研究的专业人士及科研人员。使用场景及目标：适用于需要对假肢进行动态性能测试的研发机构或企业，目标是选择合适的机械臂并构建完整的假肢测试平台，提高仿线的准确性和可靠性。阅读建议：重点理解和掌握RTHS方法的工作原理以及机械臂在仿真实验中的角色，在实践中注意验证机械臂是否符合所列出的各项要求。

FLUENT与MATLAB协同：基于UDP的复杂数据联合仿真计算与交互处理方案,FLUENT与MATLAB协同：基于UDP的复杂数据联合仿真处理系统,FLUENT与MATLAB联合仿真计算，基于UDP: FLUENT与MATLAB协同：基于UDP的复杂数据联合仿真计算与交互处理方案,FLUENT与MATLAB协同：基于UDP的复杂数据联合仿真处理系统,FLUENT与MATLAB联合仿真计算，基于UDP，可在MATLAB实现复杂数据计算处理。提供两个软件数据交互方法和接口，FLUENT数据传递给MATLAB后，可以用任意方法处理，最后再回传给FLUENT处理后的数据。本案例只是简单演示效果，可以实现复杂功能。 ,联合仿真计算; UDP接口通信; 数据处理; 交互方法; 回传数据; 复杂功能演示。,FLUENT与MATLAB协同：UDP接口数据交互与复杂处理

postgresql安装教程.md: postgresql安装教程.md

IPMSM数学模型深度解析：双环模拟技术，预测电机对多样输入的响应，精准输出电流、转速与转矩,IPMSM模型分析电机响应,IPMSM数学模型，模拟电机对不同输入的响应，包含速度环和电流环，输出电流转速: IPMSM数学模型深度解析：双环模拟技术，预测电机对多样输入的响应，精准输出电流、转速与转矩,IPMSM模型分析电机响应,IPMSM数学模型，模拟电机对不同输入的响应，包含速度环和电流环，输出电流转速和转矩。 ,IPMSM数学模型; 电机响应模拟; 速度环和电流环; 输出电流转速和转矩; 电机控制,IPMSM模型模拟电机响应：双环控制下电流转速与转矩输出

基于CNN-RBF神经网络的优化数据分类预测模型-以交叉验证防止过拟合的Matlab代码实现,Matlab结合CNN-RBF进行数据分类优化,基于卷积神经网络结合径向基函数神经网络(CNN-RBF): 基于CNN-RBF神经网络的优化数据分类预测模型——以交叉验证防止过拟合的Matlab代码实现,Matlab结合CNN-RBF进行数据分类优化,基于卷积神经网络结合径向基函数神经网络(CNN-RBF)的数据分类预测 CNN-RBF数据分类优化参数为扩散速度，采用交叉验证防止过拟合 matlab代码注：要求 Matlab 2019A 及以上版本 ,核心关键词：卷积神经网络（CNN）; 径向基函数神经网络（RBF）; 数据分类预测; 优化参数; 扩散速度; 交叉验证; 过拟合; MATLAB代码 2019A以上版本,基于CNN-RBF的优化参数数据分类预测Matlab代码实现

多变量模式分析在脑电数据中的深度应用：从磁共振到时频域的神经表征研究,多变量模式分析在脑电数据中的深度应用：从磁共振到时频域的神经表征研究,多变量模式分析最早应用在磁共振数据中，用来考察某些脑区在编码: 多变量模式分析在脑电数据中的深度应用：从磁共振到时频域的神经表征研究,多变量模式分析在脑电数据中的深度应用：从磁共振到时频域的神经表征研究,多变量模式分析最早应用在磁共振数据中，用来考察某些脑区在编码不同条件的刺激时是否存在表征上的显著不同。后来逐渐运用到脑电数据中，虽然脑电数据的空间分辨率较低，但时间分辨率很高，因此可以帮助确定在哪一段时间内，个体对不同条件刺激的表征有显著差异。目前已经有很多工具箱支持脑电数据MVPA的分析，例如matlab中ADAM，python中的NeuroRA等（这两个相对来说比较好上手）。方法共包括基础的时间序列解码，以及衍生方法跨时域解码与权重投射等。 MVPA不仅可以应用在原始时域数据上，也可以应用在时频域数据上，来观察不同频段的能量对于编码不同刺激过程中的贡献。 ,多变量模式分析（MVPA）;磁共振数据;脑电数据;时间分辨率;工具箱支持;ADAM;NeuroRA;时间序列解码;跨时域解码;权重投射;时频域分析。,多变量模式分析在脑电数据中的应用：从磁共振到时频域的表征研究

源代码-高清网络电视播放器插件多线路版 v1.1.zip: 更多毕业设计https://cv2022.blog.csdn.net/article/details/124463185

java-springboot+vue乒乓球馆预约管理系统毕业设计源码.zip: 系统选用B/S模式，后端应用springboot框架，前端应用vue框架， MySQL为后台数据库。本系统基于java设计的各项功能，数据库服务器端采用了Mysql作为后台数据库，使Web与数据库紧密联系起来。在设计过程中，充分保证了系统代码的良好可读性、实用性、易扩展性、通用性、便于后期维护、操作方便以及页面简洁等特点。

单片机设计点阵电子显示屏设计与实现的详细项目实例（含完整的硬件电路设计，程序设计、GUI设计和代码详解）: 内容概要：本文档详细介绍了基于单片机的点阵电子显示屏的设计与实现项目。项目涵盖从理论背景、项目目标、硬件设计、软件开发到最后的应用与未来扩展等多个方面。首先阐述了点阵显示屏的广泛应用和技术背景，接着定义了项目的具体目标，包括实现文字滚动、图像展示等功能，同时深入解析了硬件部分的选型和连接细节，如单片机（STM32）、LED点阵模块及其驱动电路。在软件部分，文中演示了I2C通信协议的代码示例，并展示了如何通过嵌入式编程控制显示屏的效果，如显示固定字符、实现文字滚动等。此外，文章还讨论了调试和优化的方法论及注意事项，最后对未来发展方向提出了展望，如多显示屏协同、触摸屏输入的支持等。适合人群：从事嵌入式系统开发的专业技术人员、电子工程专业的大学生及研究人员。使用场景及目标：①嵌入式系统开发课程的案例研究；②工业设计公司或科研单位的项目参考；③高校实验室开展相关课题的研究资料。阅读建议：对于初次接触嵌入式开发的新手，建议先掌握基础知识，熟悉所使用的单片机型及其外设接口功能后再开始本项目的学习；而对于有经验的研发人员，则可以重点关注具体的实现技术和遇到问题时的解决方案部分，结合自身需求进行灵活运用。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论