- 浏览: 20812 次
- 性别:
- 来自: 信阳
最新评论
-
Mybeautiful:
协议无处不在,当我跟你说“你收到我邮件后,立刻回一封。”这就是 ...
协议论 -
jcs130:
哈哈~顶~~
2011年 暑假集训(7.22~8.22)
略谈Hash
这几天自己写了个hash表,以前都是用的系统的,现在轮到自己写了,写的还是比较菜的,希望自己继续扩充吧,下面就简单介绍一下。
一、引文
先分析一下最基本的两种数据结构:数组和链表
优缺点分析:
数据结构 |
数据查找 |
数据增删 |
数组 |
数据储存地址是连续,对于查找数据时可以通过数组下标很快定位 |
需要重新分配空间,所耗时间较多 |
链表 |
数据之间只是通过一个地址在连接,查找数据时需要遍历许多不必要的数据 |
由于本身数据之间的连接是通过地址的指向,所以只需要改变一下指向 |
由上可以看出,以上两种数据结构在数据上的查找与增删都有自己的优缺点,而hash结构就是综合了两者的优点。
二、数据结构——Hash表
1).图示结构
2). 从上面的结构图可以看出,hash表整体是以数组为载体,数组内部元素以链表形式存在的,hash表所需要的就是把所要储存的元素平均分配到各个挂表上去,此时所需要的就是hash函数了,我所实现的哈希表是对字符串形式数据的操作,常用字符串哈希函数有BKDRHash,APHash,DJBHash,JSHash,RSHash,SDBMHash,另外还有ELFHash,APHash等等,都是十分简单有效的方法。这些函数使用位运算使得每一个字符都对最后的函数值产生影响。另外还有以MD5和SHA1为代表的杂凑函数,这些函数几乎不可能找到碰撞。
算是站在巨人的肩膀上,我基本写出了一个像样的hash表。
以上常用的几个hash函数代码实现及比较,我已经上传到下面的附件,大家可以看一下。
三、代码示例
1)一些所需要的数据变量:
private int hash_length = 0;// 数组长度
private int threatHold = 0;// 重新加载的条件
private DataNode dataNodes[];// 数据表
private double load_factor = 0.8f;// 加载因子
private int size = 0;// 数据的数目
private static int default_hash_size = 10;// 数组初始大小
private int MAXIMUM_NODE = 1 << 30;// 数据最大值
2)数据的插入及删除
// 以数据单项插入 public synchronized void insert(String data) { int hash = hash(data); DataNode node = new DataNode(data); if (dataNodes[hash] == null) dataNodes[hash] = node; else { DataNode fatherNode = dataNodes[hash]; DataNode childNode = dataNodes[hash].getNextNode(); while (childNode != null) { fatherNode = childNode; childNode = childNode.getNextNode(); } childNode = node; fatherNode.setNextNode(childNode); } if (size++ > threatHold) { rehash(); } if (size > MAXIMUM_NODE) { throw new RuntimeException("Sorry,散列表已满!!!"); } } // 以数据形式删除数据项 public synchronized void delete(String data) { int hash = hash(data); DataNode node = new DataNode(data); if (dataNodes[hash] == null) { throw new RuntimeException("该数据项不存在"); } else if (dataNodes[hash].equals(node)) { dataNodes[hash] = dataNodes[hash].getNextNode(); } else { DataNode rootNode = dataNodes[hash].getNextNode(); while (rootNode != node) { if (rootNode == null) throw new RuntimeException("该数据项不存在"); rootNode = rootNode.getNextNode(); } } size--; }
3)我借用了一下前人的RS hash函数,系统是通过每个对象的hashcode进行操作
// hash函数用来计算数据的key值 public int hash(String data) { //RS hash char[] datas = data.trim().toCharArray(); int temp1 = 378551; int temp2 = 63689; int hash = 0; for(char ch:datas){ hash = hash * temp2 + ch; temp2 *= temp1; } return (hash & 0x7FFFFFFF)%hash_length; }
4)比较重要的一点,当hash表数据量达到了开始设定的边界,便需要再次加载,称之为rehash
// 重新装载
public synchronized void rehash() {
System.out.println("又要重新加载了.......");
hash_length = hash_length << 1;// 扩充为原来的两倍
if (hash_length > MAXIMUM_NODE) {
throw new RuntimeException("对不起,数组长度已达到最大!!");
}
DataNode newNodes[] = new DataNode[hash_length];
for (DataNode node : dataNodes) {
while (node != null) {
String data = node.getData();
int hash = hash(data);
DataNode nodeNew = new DataNode(data);
if (newNodes[hash] == null)
newNodes[hash] = nodeNew;
else {
DataNode fatherNode = newNodes[hash];
DataNode childNode = newNodes[hash].getNextNode();
while (childNode != null) {
fatherNode = childNode;
childNode = fatherNode.getNextNode();
}
childNode = nodeNew;
fatherNode.setNextNode(childNode);
}
node = node.getNextNode();
}
}
// 复制原来的数据
dataNodes = newNodes;
setThreatHold();
}
四.后文
这实现的基本上只有一个架构,对于很多的细节方面考虑还比较少,接下来主要考虑的还是数据的均分问题,估计更多的还是需要用到位运算,还需要继续下去....
发表评论
-
协议论
2011-09-29 01:49 992一、引文 “协议”, ... -
哈弗曼树以及压缩运用
2011-08-14 16:56 1623一.介绍 其实在还没有学习压缩之前,在学校学习中已 ... -
树与二叉树
2011-08-12 22:34 796一、介绍 对于java中“树”这个概念,顾名思义就像是现实中 ... -
链表 小结
2011-08-09 21:29 706... -
星雨——项目总结
2011-08-07 16:25 839一、项目主类: 1.Ball(子弹);2.Ba ... -
多线程 小结
2011-08-01 22:28 839一. 介绍 每个java程序都至少有一 ... -
String 小结
2011-08-01 22:27 799一.String 类是一个比较相当重要的类,像网络上很多数据 ... -
BMP
2011-07-30 23:49 832一、 介绍 开始之前先讲一 ... -
异常机制 小结
2011-07-26 17:07 698异常机制是指当程序出现错误后,程序如何处理。具体来说,异常机制 ... -
文件操作小结
2011-07-26 16:46 703系统中的文件可分为三种:目录文件、真实文件、缓存文件。j ... -
KeyWords Summary
2011-07-25 00:21 793... -
集合框架 小结
2011-07-24 23:30 666Java 中集合类定义主要 ... -
事件和监听器的使用
2011-07-23 22:58 7441 .事件其实无处不在,每个人不管是在干什么,都是事件,在类里 ... -
类与对象
2011-06-09 23:42 389 类是对象的抽象化,也就相当于与一种类型eg:int,dou ... -
登陆界面开发
2011-06-09 23:41 6961. Eclipse的简单操作 Alt+’/’ 方法提示符 ... -
方法的重载与重写,自动转型与强制转型,多态的理解
2011-06-09 01:51 9951.方法的重载与重写? 两者都是对于函数的操作,区别在于重载是 ... -
类,抽象类,接口的特点,区别
2011-06-09 01:49 709类,抽象类,接口的特点,区别 /////////////// ...
相关推荐
**三维Hashin失效准则详解** 在复合材料领域,失效分析是至关重要的,它关系到材料的性能预测和结构安全。Hashin失效准则是一种广泛应用的多向复合材料失效理论,由Shlomo Hashin于1962年提出,主要用于评估多向受...
UTHASH 是一个开源的 C 语言库,提供了一种简单且高效的哈希表实现,用于在 C 代码中快速查找和管理数据结构。这个库的主要功能是提供一个宏定义的集合,可以方便地将结构体转化为哈希表,进而进行添加、删除、查找...
该套开源代码采用宏的方式实现hash函数的相关功能,支持C语言的任意数据结构最为key值,甚至可以采用多个值作为key,无论是自定义的struct还是基本数据类型,需要注意的是不同类型的key其操作接口方式略有不通。...
标题中的"HASHIN.rar_ABAQUS_Hashin失效准则 abaqus_abaqus hashin_abaqus 三维Hashi"表明这是一个关于ABAQUS软件中应用Hashin失效准则进行三维分析的示例或教程。ABAQUS是一款广泛应用的有限元分析软件,尤其在结构...
在复合材料领域,Hashin失效准则是一个非常重要的理论模型,尤其在分析三维层合板的强度和稳定性时。Hashin准则由Stanley Hashin在20世纪60年代提出,用于预测多向复合材料的破坏行为。这个准则考虑了内部微裂纹的...
标题 "UMAT_Hashin3D_hashin" 指涉的是一个专门针对复合材料损伤分析的三维子程序,该程序基于Hashin破坏准则。在有限元分析(FEA)中,用户自定义材料(User-Defined Material,UMAT)是实现特定材料行为建模的一种...
在IT领域,Hash值是一种广泛使用的数据校验方式,它能够为任何大小的文件生成一个固定长度的唯一标识,这个标识通常称为哈希值或散列值。Hash值查看及修改软件,如"Hash_1.0.4_0523.exe"和"HashModifier.exe",是...
内容描述:用于crypto中hash爆破的强大工具。 优势:相较于其他hash工具,具有更快的算力,使用方便简洁。 适用:适用于md5,sha256等典型hash加密方式,反推出所需的源码。
在IT行业中,尤其是在科学计算和工程模拟领域,Hashin失效准则和VUMAT(User-Defined Material subroutine for Nonlinear Analysis in ABAQUS)是两个非常重要的概念。这两个概念主要应用于复合材料、土木工程等领域...
2. `geohash-demo.js`:包含`GEOHASH`的JavaScript实现代码,可能包括编码、解码以及相邻`GEOHASH`的计算功能。 3. `labeledmarker.js`:可能是一个辅助库,用于在地图上绘制带有标签的标记,用于展示`GEOHASH`对应...
MurmurHash算法由Austin Appleby创建于2008年,现已应用到Hadoop、libstdc 、nginx、libmemcached,Redis,Memcached,Cassandra,HBase,Lucene等开源系统。2011年Appleby被Google雇佣,随后Google推出其变种的...
在STM32F407上实现的哈希(Hash)算法是数字签名、数据完整性验证等安全应用中的关键组成部分。哈希算法能够将任意长度的输入数据转化为固定长度的输出,通常称为哈希值或消息摘要。 哈希算法的主要特性包括: 1. *...
在IT行业中,尤其是在模拟仿真和材料科学领域,Hashin失效准则是一种广泛应用的理论,用于预测多相复合材料的破坏行为。VUMAT(User-Defined Viscoplasticity and Damage Material Subroutine)是ABAQUS软件中的一个...
hashcat is the world’s fastest and most advanced password recovery tool. This version combines the previous CPU-based hashcat (now called hashcat-legacy) and GPU-based oclHashcat. Hashcat is ...
Hashcat is the self-proclaimed world's fastest password recovery tool. It had a proprietary code base until 2015, but is now released as free software. Versions are available for Linux, OS X, and ...
常见的哈希算法有MD5(Message-Digest Algorithm 5)、SHA-1(Secure Hash Algorithm 1)、SHA-256等。这些算法的特点是:即使输入数据微小的变化也会导致输出的哈希值显著不同,这就使得哈希值成为验证数据完整性的...
RS-Hash Function Value: " + ghl.RSHash(key)); System.out.println(" 2. JS-Hash Function Value: " + ghl.JSHash(key)); System.out.println(" 3. PJW-Hash Function Value: " + ghl.PJWHash(key)); System....
在IT领域,尤其是在地理信息系统(GIS)和大数据分析中,Geohash是一种广泛使用的空间索引技术。Node.js是流行的JavaScript运行环境,它允许开发者在服务器端执行JavaScript代码。结合这两个概念,"nodejs geohash...
在Android开发中,Geohash是一种非常实用的地理编码技术,它通过将地理位置转换为字符串,使得我们可以方便地存储、查询和比较这些位置数据。Java中的Geohash工具类可以帮助开发者处理与地理位置相关的任务,提高...