- 浏览: 421939 次
- 性别:
- 来自: 北京
文章分类
- 全部博客 (318)
- js (20)
- JQuery (2)
- Java (46)
- Oracle (4)
- mysql (21)
- ExtJs (17)
- Excel (2)
- Linux (8)
- Sql (8)
- Jsp (2)
- hibernate (12)
- jbpm (17)
- eclipse (8)
- 名博收藏 (1)
- Junit (2)
- 应用集成 (3)
- web (10)
- jboss (3)
- Rest (3)
- 其它 (7)
- 磁盘分区管理 (1)
- spring (18)
- SSO (4)
- tomcat (4)
- CSS (7)
- MemCached (6)
- EhCache (4)
- weblogic (1)
- apache (6)
- Exception design (1)
- db (1)
- 分析模式 (1)
- jstl (1)
- jsf (0)
- firefox (2)
- MongoDB (4)
- androidpn (1)
- hadoop (1)
- cvs (1)
- 微信公众号 (2)
- 高并发 (4)
- 技术论坛 (1)
- CDN (1)
- JVM (16)
- 加密 (4)
- maven (2)
- jenkins (1)
- hessian (1)
- 大数据处理 (2)
- NIO (0)
- netty (1)
- redis (1)
- git (1)
- Elastic Job (0)
最新评论
-
zgw06629:
或者<pre>aaaabbbbcccc</p ...
javaDoc注释换行 -
ddnzero:
...
StringBuffer换行 -
maosijun:
。。。。
EXT CExt.form.ComboBox选择一次后只剩一个选项 -
ysa198584:
你这有问题,当我的代码出现User.class的时候,反编绎的 ...
java的class文件批量反编译 -
dongj0325:
看到您的博客,很受启发,但还有关于jbpm4.4 timer使 ...
JBPM定时器(Timer)之Repeat属性不能使用变量
http://wenku.baidu.com/view/f427cf23dd36a32d7375819f.html
Hashtable从JDK1.0就已经有了, 所以让我们先来看看它是怎么工作, 然后有浅入深, 来研究HashMap的原理, 以及两者的不同点.
Hashtable有几个主要的字段, 如下,
/**
* The hash table data.
*/
private transient Entry[] table;
/**
* The total number of entries in the hash table.
*/
private transient int count;
/**
* The table is rehashed when its size exceeds this threshold. (The
* value of this field is (int)(capacity * loadFactor).)
*
* @serial
*/
private int threshold;
其中最重要的就是那个table数组了. 它就是整个hashtable的基本数据结构! 在来看一下这个字段
private transient Entry[] table;
可以看到, hashtable的基本数据结构就是, 一个包涵Entry类的二维数组. 而这个Entry类是hashtable的内在类, 它其实是一个单向链, 让我们详细分析一下.
private static class Entry<K,V> implements Map.Entry<K,V> {
int hash;
K key;
V value;
Entry<K,V> next;
...
...
看到这里有没有想到学校里教的数据结构原理这门课呢? Entry类就是定义了一个很简单的单向链结构, 它里面包括key, value和下个Entry类的对象next.
在这里我在强调一下, hashtable的数据结构就是一个包涵单向链的二维数组.
接下来让我们来看看hashtable的构造器是长的什么样的.
最长用的
public Hashtable() {
this(11, 0.75f);
}
这个构造器调用了另外一个构造器
public Hashtable(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal Load: "+loadFactor);
if (initialCapacity==0)
initialCapacity = 1;
this.loadFactor = loadFactor;
table = new Entry[initialCapacity];
threshold = (int)(initialCapacity * loadFactor);
}
细读代码后, 我们发现这个构造器构造了table字段和threshold. Table前面已经详细讲了, 那么这个threshold又是什么东东呢?
其实这个threshold对hashtalbe的性能影响是很大的! 因为table是个数组, 如果在hashtable中保存的实体大于一定的数量后, 对数据的读写就会有很慢, 那是因为, 很多数据都保存在entry类的单向链中, 每次读写都要比对链中所有的数据, 链越长读写就越慢.
所以当数据容量大于threshold的时候, hashtable就会做rehash(), rehash把table的容量扩大一倍, 再把从前在table里的数据统统搬回新的table. 这样的一个过程, 开销是多么的大呀.
threshold = (int)(initialCapacity * loadFactor);
Hashtable类提供了构造涵数, 用户可以自定, intitialCapacity和loadFactor. 对于那些大概知道容量的hashtable, 用户应该自定intitialCapacity. 这样的话, 就可以省去一大笔rehash的开销.
现在让我们来看hashtable的put和get操作
public synchronized V get(Object key) {
Entry tab[] = table;
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
return e.value;
}
}
return null;
}
先来看get方法, get可谓是hashtable中的最基本方法了, 它是通过key来拿到hashtable中的value.
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
从key拿到hashCode, 从hashCode再计算出在table中的index, 也就是在数组中的第几个列.
至于为什么要与 0x7FFFFFFF, 那是hashtable 提供的hash算法, hashMap提供了不同的算法, 用户如果要定义自己的算法也是可以的. 如果要知道不同的具体算法, 就google or 百度一下吧.
好了, 现在我们有了index, 就可以到table数组里的entry单向链去找value啦.
for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
return e.value;
}
}
for语句就是简单的检索entry的单链, if语句检查key是否相同. 这里就遇到了java学习中的一个重大知识点. hasCode()和equal()的关系.
大家都学过如果hasCode()的值相同的话, equal不一定相同, 而如果equal相同的话, hasCode一定要相同. 但那是为什么呢? 其实答案就在上面的代码中!
Hashtable 的数据结构是一个包涵单向链的二维数组. 从hasCode我们得到hash和index, 并得以确定这个key在table数组中的第几个列, 然而这显然是不够的, 因为, entry类是一个单向列, 它可以是一个, 也可能是很多个key组成, 那么要从一系列有着相同hasCode的entry中找到, 我们所要的key的话, 就要用equals了. 只有两个key是相等的, 那才是我们要找的. 找到key之后, 只要简单的把value返回就好了. 如果对entry类还有疑问的话, 请参考前面的解释.
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
throw new NullPointerException();
}
// Makes sure the key is not already in the hashtable.
Entry tab[] = table;
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
V old = e.value;
e.value = value;
return old;
}
}
modCount++;
if (count >= threshold) {
// Rehash the table if the threshold is exceeded
rehash();
tab = table;
index = (hash & 0x7FFFFFFF) % tab.length;
}
// Creates the new entry.
Entry<K,V> e = tab[index];
tab[index] = new Entry<K,V>(hash, key, value, e);
count++;
return null;
}
接下来再来看看put方法, 理解了get, put就很容易弄明白了.
首先, 要放入hashtable的value不能是null, 否则就报错.
其次, 然后要确保key不能已经在hashtable里面, 有的话, 就返回value.
再次, 检查是否容量已经太大, 如果太大话就rehash, 这会是一个很浪费资源的方法, 请参考前文.
最后, 也是最重要的, 我们要把key-value保存到hashtable中去.
Entry<K,V> e = tab[index];
tab[index] = new Entry<K,V>(hash, key, value, e);
1.拿到当前在table数组中的entry对象.
2.根据传入的key和value建一个新的entry并赋予给当前的table的index中
protected Entry(int hash, K key, V value, Entry<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
这是entry类的构造函数. 简单的说, 就是在单链的最前端加了个新的entry对象. 从这里也可以看出, 对于那些后写入的object, 反而可以以比较快的速度读出, 那是因为后写入的object, 总是在链的前端.
看完了hashtable, 我们在来看看hashMap
hashMap可以算作是hashtable的升级版本, 最早从1.2开始有的.
整体上hashMap对hashtable类优化了代码. 比如说, 消除了hardcoding, 增加了code reuse等等.
但是, 两者之间最主要的不同有两点.
1.hashMap的读写是unsynchronized, 在多线程的环境中要注意使用
而hashtable是synchronized
这两者的不同是通过在读写方法上加synchronized关键字来实现的.
hashMap
public V put(K key, V value)
public V get(Object key)
hashtable
public synchronized V get(Object key)
public synchronized V put(K key, V value)
可能有人问, 能synchronized, 能线程安全好啊. 为什么不要呢?
这里其实还是一个效率的问题. 对于线程安全的方法, 系统要进行加锁, 减锁操作. 性能会有很大的影响. 由于很多程序是在单线程或者说是线程安全的情况下工作的, 所以用synchronized就显得多余了.
3.第二个不同是hashMap可以放空值, 而hashtable就会报错.
hashMap
public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
hashtable
public synchronized V put(K key, V value) {
// Make sure the value is not null
if (value == null) {
throw new NullPointerException();
}
发表评论
-
serialVersionUID的作用
2016-02-29 11:59 451serialVersionUID的作用 简单来说,J ... -
ArrayList实现原理
2015-08-20 09:32 3911. ArrayList概述: A ... -
HashMap实现原理分析
2015-08-20 09:12 539HashMap 目录(?)[+] 1. H ... -
高性能IO模型浅析
2015-08-05 16:42 342高性能IO模型浅析 2014- ... -
JVM调优总结 -Xms -Xmx -Xmn -Xss
2012-07-27 17:31 782http://unixboy.iteye.com/blog/1 ... -
消息总线设计系列之 - 调停者模式
2012-05-28 16:52 1225http://kb.cnblogs.com/a/1200926 ... -
关于Java构造器
2012-04-25 17:27 796关于Java构造器 作者:langm 版权声明:任何获得M ... -
面向对象的三个基本特征
2012-04-25 15:37 638转自: http://www.cnitblog.com/Li ... -
java 继承类 变量、静态变量、构造函数执行顺序
2012-04-18 16:01 884java 继承类 变量、静态变量、构造函数执行顺序 clas ... -
通过分析 JDK 源代码研究 TreeMap 红黑树算法实现
2012-04-03 11:06 780http://www.ibm.com/developerwor ... -
java泛型
2012-03-27 11:27 692http://baike.baidu.com/view/143 ... -
Java中的Enum的使用与分析
2012-03-27 09:38 695Java中的Enum的使用与分析 示例: ... -
使用common-fileUpload制作文件上传(DiskFileItemFactory方式)
2012-02-23 09:50 1146使用common-fileUpload制作文件上传(DiskF ... -
java中静态代码块的用法 static用法详解(摘抄,用断点调试效果很好)
2011-07-23 11:28 1517原文:http://zhangyongbluesky.blog ... -
Java类的static块什么时候执行
2011-07-23 11:18 909http://joes0619.blog.163.com/bl ... -
JAXP(Java API XML Parser)
2011-07-16 14:20 621http://www.cnblogs.com/kelin131 ... -
static块到底什么时候执行?
2011-07-16 10:23 638http://www.iteye.com/topic/1100 ... -
Java Endorsed Standards Override Mechanism
2011-05-20 10:56 1022Introduction From time to time ... -
Java 类的热替换 —— 概念、设计与实现
2011-05-19 10:05 715构建基于 Java 的在线升级系统 孙 鸣, 软件 ... -
关于ClassLoader的几个概念
2011-05-17 17:13 1018What is ClassLoader? 与普通 ...
相关推荐
本文将深入探讨基于C语言实现的HashTable,解析其源码,揭示其工作原理和优化策略。 一、哈希表的基本概念 1. 哈希函数:哈希表的核心是哈希函数,它将键转化为数组索引,使得键值可以快速定位。一个好的哈希函数...
哈希表(hashtable)是根据哈希算法进行设计的一种数据结构,通过哈希函数H(key)和解决冲突的方法将一组关键字映射到有限的地址区间上。每个关键字在地址区间中的位置即为记录存储的位置。然而,传统的HashMap在多...
Java源码解析HashMap简介 HashMap是Java开发中最常用的集合之一,它基于hash表的实现,提供了map的所有可选操作,并且允许null值和一个null的key。HashMap的实现提供了常量级的性能,假设hash函数把元素们比较好的...
哈希表结构 struct HashTable:表示哈希表,包含一个存储节点指针的数组。 创建哈希表函数 createHashTable:动态分配哈希表的内存,并初始化哈希表数组为NULL。 哈希函数 hashCode:根据键计算哈希值,采用简单的...
### PHP7源码分享——内存管理、Zval与HashTable解析 #### 一、PHP7内存管理 PHP7的内存管理机制对于理解其底层实现至关重要。本文将深入探讨PHP7中的内存管理技术,包括内存分配器、内存对齐、内存预分配等核心...
源码解析能帮助我们深入理解反射的工作原理,以及如何安全高效地使用反射。 七、网络编程 System.Net命名空间包含网络通信的相关类,如Socket、HttpWebRequest、TcpClient等。通过源码,我们可以了解到HTTP请求的...
【PHP 源代码分析:深入理解 Zend HashTable】 ...理解其工作原理对于深入分析 PHP 源码和优化程序性能至关重要。通过熟练掌握 HashTable,开发者能够更好地理解和利用 PHP 内部的数据处理机制,提升程序的运行效率。
在给定的压缩包文件中,包含了一些关键的集合类源码,如`TreeMap`、`Hashtable`、`ArrayList`、`HashMap`、`LinkedList`、`List`、`Map`、`TreeSet`、`LinkedHashMap`和`Set`。这些类都是Java集合框架的重要组成部分...
PHP的变量在内存中的表示和管理是通过`zend_variable`结构体完成的,而符号表(`HashTable`)则存储了所有变量的信息。在PHP 5.5.3中,变量的生命周期管理和垃圾回收机制得到了进一步优化。 6. **对象模型** ...
5. **System.Collections**: 包含各种集合类,如ArrayList、Dictionary和Hashtable。源码中可以找到如何高效存储和检索数据的实现。 三、基础结构与设计原则 System命名空间的源码遵循了面向对象设计原则,如封装...
更新类IBatisNet.DataMapper.MappedStatements.ResultStrategy.DictionaryStrategy,处理数据输出类型是HashTable, 不能解析特定数据库专有数据类型的错误
### 关联规则的程序设计(源码) #### 实验背景 本实验来自西安建筑科技大学信息与控制工程学院的《决策支持课程实验》,旨在通过实践加深学生对于关联规则的理解,并掌握如何利用关联规则进行数据挖掘的基本技能...
- `HashTable.cpp`:哈希表实现,用于存储中间搜索结果,提高搜索效率,减少重复计算。 - `ucci.cpp`:实现了UCCI协议的接口,处理来自用户界面的命令并返回引擎的结果。 - `PreMove.cpp`和`FenBoard.cpp`:可能...
### 暴雪哈希算法源码解析与应用 #### 一、暴雪哈希算法简介 暴雪娱乐(Blizzard Entertainment)是一家知名的电子游戏开发公司,其在游戏开发领域有着丰富的经验和深厚的技术积累。其中,一个被广泛讨论且具有较...
以下是对Spring 3.1源码的详细解析和相关知识点的介绍。 1. **AOP(面向切面编程)增强**: - Spring 3.1 引入了基于注解的切入点表达式,允许开发者在注解中直接定义切入点,简化了配置。 - 提供了`@Profile`...
### ASP.NET购物车代码解析与实现 在电子商务网站开发中,购物车功能是不可或缺的一部分,它允许用户在不立即购买的情况下存储所选商品,以便稍后结算。在本篇文章中,我们将深入分析并理解一段ASP.NET购物车代码,...
本实例源码提供了学习哈希表的良好素材,特别是对于想要探索Linux内核中哈希表实现的开发者。 哈希表的核心思想是散列,即将键通过一个函数转换为数组的索引,使得键与存储位置之间形成一种映射关系。这个函数通常...
《STL源码剖析》这本图书,是由华中科技大学出版社出版,作者侯捷详细解析了STL的源码,旨在帮助读者深入理解STL的实现原理和机制。 首先,STL的适用范围和读者定位非常明确。它并不适合C++初学者、泛型编程技术...
《HashMap 源码解析——JDK11版本》 HashMap是Java中广泛使用的非同步散列表,其设计和实现是高效且灵活的。在JDK1.8之前,HashMap的底层数据结构采用的是数组+链表的方式,这种方式称为“拉链法”来解决哈希冲突。...