Java最基本的数据结构有数组和链表。
数组的特点是空间连续(大小固定)、寻址迅速,但是插入和删除时需要移动元素,所以查询快,增加删除慢。
链表恰好相反,可动态增加或减少空间以适应新增和删除元素,但查找时只能顺着一个个节点查找,所以增加删除快,查找慢。
有没有一种结构综合了数组和链表的优点呢?当然有,那就是哈希表(虽说是综合优点,但实际上查找肯定没有数组快,插入删除没有链表快,一种折中的方式吧)。
HashMap的数据结构是由Entry链表组成的数组。
一、HashMap定义:
public class HashMap<K,V>
extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable
从上述定义中可以看出:
1. HashMap是继承了AbstractMap类,
2. HashMap实现了Map接口。
3. HashMap实现了Cloneable接口,即实现clone()函数。它能被克隆。
4. HashMap实现了java.io.Serializable接口,可以被序列化。
5. HashMap支持泛型。
二、HashMap基本属性:
HashMap的基本属性包括:初始容量、最大容量、装载因子、存放数据的entry数组、map大小等。
/**
* 默认的初始容量,必须是2的幂
*/
static final int DEFAULT_INITIAL_CAPACITY = 16;
/**
* 最大容量(必须是2的幂且小于2的30次方,传入容量过大将被这个值替换)
*/
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
* 默认装载因子,这个后面会做解释
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* 存储数据的Entry数组,长度是2的幂。看到数组的内容了,接着看数组中存的内容就明白为什么博文开头先复习数据结构了
*/
transient Entry[] table;
/**
* map中保存的键值对的数量
*/
transient int size;
/**
* 需要调整大小的极限值(容量*装载因子),即map容量阀值
*/
int threshold;
/**
* 装载因子
*/
final float loadFactor;
/**
* map结构被改变的次数
*/
transient volatile int modCount;
三、HashMap构造方法:
1. 第一个构造方法(不带参数):
/**
* 使用默认的容量及装载因子构造一个空的HashMap
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR;
threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);//计算下次需要调整大小的极限值
table = new Entry[DEFAULT_INITIAL_CAPACITY];//根据默认容量(16)初始化table
init();
}
2. 第二个构造方法(带一个参数:初始容量):
/**
* 根据指定容量创建一个空的HashMap
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);//调用上面的构造方法,容量为指定的容量,装载因子是默认值
}
3. 第三个构造方法(带两个参数指定初始容量和装载因子):
/**
* 根据给定的初始容量的装载因子创建一个空的HashMap
* 初始容量小于0或装载因子小于等于0将报异常
*/
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)//调整最大容量
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
int capacity = 1;
//设置capacity为大于initialCapacity且是2的幂的最小值
while (capacity < initialCapacity)
capacity <<= 1;
this.loadFactor = loadFactor;
threshold = (int)(capacity * loadFactor);
table = new Entry[capacity];
init();
}
4. 第四个构造方法(传入一个已有的map):
/**
* 通过传入的map创建一个HashMap,容量为默认容量(16)和(map.zise()/DEFAULT_LOAD_FACTORY)+1的较大者,装载因子为默认值
*/
public HashMap(Map<? extends K, ? extends V> m) {
this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
putAllForCreate(m);
}
上面的构造方法中调用到了init()方法,最后一个方法还调用了putAllForCreate(Map<? extends K, ? extends V> m)。init方法是一个空方法,里面没有任何内容。putAllForCreate看方法名就是创建的时候将传入的map全部放入新创建的对象中。该方法中还涉及到其他方法,将在后面介绍。
四、HashMap的Entry内部类实现:
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;//对下一个节点的引用(看到链表的内容,结合定义的Entry数组,是不是想到了哈希表的拉链法实现?!)
final int hash;//哈希值
Entry(int h, K k, V v, Entry<K,V> n) {
value = v;
next = n;
key = k;
hash = h;
}
public final K getKey() {
return key;
}
public final V getValue() {
return value;
}
public final V setValue(V newValue) {
V oldValue = value;
value = newValue;
return oldValue;//返回的是之前的Value
}
public final boolean equals(Object o) {
if (!(o instanceof Map.Entry))//先判断类型是否一致
return false;
Map.Entry e = (Map.Entry)o;
Object k1 = getKey();
Object k2 = e.getKey();
// Key相等且Value相等则两个Entry相等
if (k1 == k2 || (k1 != null && k1.equals(k2))) {
Object v1 = getValue();
Object v2 = e.getValue();
if (v1 == v2 || (v1 != null && v1.equals(v2)))
return true;
}
return false;
}
// hashCode是Key的hashCode和Value的hashCode的异或的结果
public final int hashCode() {
return (key==null ? 0 : key.hashCode()) ^
(value==null ? 0 : value.hashCode());
}
// 重写toString方法,是输出更清晰
public final String toString() {
return getKey() + "=" + getValue();
}
/**
*当调用put(k,v)方法存入键值对时,如果k已经存在,则该方法被调用(为什么没有内容?)
*/
void recordAccess(HashMap<K,V> m) {
}
/**
* 当Entry被从HashMap中移除时被调用(为什么没有内容?)
*/
void recordRemoval(HashMap<K,V> m) {
}
}
五、HashMap的put()方法:
public V put(K key, V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(hash, key, value, i);
return null;
}
hash():
static int hash(int h) {
// This function ensures that hashCodes that differ only by
// constant multiples at each bit position have a bounded
// number of collisions (approximately 8 at default load factor).
h ^= (h >>> 20) ^ (h >>> 12);
return h ^ (h >>> 7) ^ (h >>> 4);
7 }
然后调用indexFor方法返回hash值和table数组长度减1的与运算结果。
为什么使用的是length-1?因为这样可以保证结果的最大值是length-1,不会产生数组越界问题。
indexFor():
static int indexFor(int h, int length) {
return h & (length-1);
}
获取索引位置之后做了什么?探测table[i]所在的链表,所发现key值与传入的key值相同的对象,则替换并返回oldValue。若找不到,则通过addEntry(hash,key,value,i)添加新的对象。来看addEntry(hash,key,value,i):
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
resize(2 * table.length);
}
这就是在一个链表头部插入一个节点的过程。获取table[i]的对象e,将table[i]的对象修改为新增对象,让新增对象的next指向e。之后判断size是否到达了需要扩充table数组容量的界限并让size自增1,如果达到了则调用resize(int capacity)方法将数组容量拓展为原来的两倍。
resize():
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
// 这个if块表明,如果容量已经到达允许的最大值,即MAXIMUN_CAPACITY,则不再拓展容量,而将装载拓展的界限值设为计算机允许的最大值。
// 不会再触发resize方法,而是不断的向map中添加内容,即table数组中的链表可以不断变长,但数组长度不再改变
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
// 创建新数组,容量为指定的容量
Entry[] newTable = new Entry[newCapacity];
transfer(newTable);
table = newTable;
// 设置下一次需要调整数组大小的界限
threshold = (int)(newCapacity * loadFactor);
}
transfer():
void transfer(Entry[] newTable) {
// 保留原数组的引用到src中,
Entry[] src = table;
// 新容量使新数组的长度
int newCapacity = newTable.length;
// 遍历原数组
for (int j = 0; j < src.length; j++) {
// 获取元素e
Entry<K,V> e = src[j];
if (e != null) {
// 将原数组中的元素置为null
src[j] = null;
// 遍历原数组中j位置指向的链表
do {
Entry<K,V> next = e.next;
// 根据新的容量计算e在新数组中的位置
int i = indexFor(e.hash, newCapacity);
// 将e插入到newTable[i]指向的链表的头部
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);
}
}
}
七、HashMap的putAll()方法:
public void putAll(Map<? extends K, ? extends V> m) {
int numKeysToBeAdded = m.size();
if (numKeysToBeAdded == 0)
return;
if (numKeysToBeAdded > threshold) {
int targetCapacity = (int)(numKeysToBeAdded / loadFactor + 1);
if (targetCapacity > MAXIMUM_CAPACITY)
targetCapacity = MAXIMUM_CAPACITY;
int newCapacity = table.length;
while (newCapacity < targetCapacity)
newCapacity <<= 1;
if (newCapacity > table.length)
resize(newCapacity);
}
for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i = m.entrySet().iterator(); i.hasNext(); ) {
Map.Entry<? extends K, ? extends V> e = i.next();
put(e.getKey(), e.getValue());
}
}
putForNullKey():
private V putForNullKey(V value) {
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0, null, value, 0);
return null;
}
putAllForCreate():
private void putAllForCreate(Map<? extends K, ? extends V> m) {
for (Iterator<? extends Map.Entry<? extends K, ? extends V>> i =
m.entrySet().iterator(); i.hasNext(); ) {
Map.Entry<? extends K, ? extends V> e = i.next();
putForCreate(e.getKey(), e.getValue());
}
}
只是调用putForCreate方法逐个元素加入。
private void putForCreate(K key, V value) {
int hash = (key == null) ? 0 : hash(key.hashCode());
int i = indexFor(hash, table.length);
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
e.value = value;
return;
}
}
createEntry(hash, key, value, i);
}
createEntry():
void createEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
size++;
}
八、HashMap的get()方法:
public V get(Object key) {
if (key == null)
return getForNullKey();
int hash = hash(key.hashCode());
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
return e.value;
}
return null;
}
getForNullKey():
private V getForNullKey() {
for (Entry<K,V> e = table[0]; e != null; e = e.next) {
if (e.key == null)
return e.value;
}
return null;
}
九、HashMap判断key或value是否存在的方法:
HashMap没有提供判断元素是否存在的方法,只提供了判断Key是否存在及Value是否存在的方法,分别是containsKey(Object key)、containsValue(Object value)。
public boolean containsKey(Object key) {
return getEntry(key) != null;
}
final Entry<K,V> getEntry(Object key) {
int hash = (key == null) ? 0 : hash(key.hashCode());
for (Entry<K,V> e = table[indexFor(hash, table.length)];
e != null;
e = e.next) {
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
}
return null;
}
containsValue():
public boolean containsValue(Object value) {
if (value == null)
return containsNullValue();
Entry[] tab = table;
for (int i = 0; i < tab.length ; i++)
for (Entry e = tab[i] ; e != null ; e = e.next)
if (value.equals(e.value))
return true;
return false;
}
private boolean containsNullValue() {
Entry[] tab = table;
for (int i = 0; i < tab.length ; i++)
for (Entry e = tab[i] ; e != null ; e = e.next)
if (e.value == null)
return true;
return false;
}
十、HashMap删除元素方法:
HashMap中“删除”相关的操作,有remove(Object key)和clear()两个方法。
1. remove():
public V remove(Object key) {
Entry<K,V> e = removeEntryForKey(key);
return (e == null ? null : e.value);
}
2. removeEntryForKey():
final Entry<K,V> removeEntryForKey(Object key) {
int hash = (key == null) ? 0 : hash(key.hashCode());
int i = indexFor(hash, table.length);
Entry<K,V> prev = table[i];
Entry<K,V> e = prev;
while (e != null) {
Entry<K,V> next = e.next;
Object k;
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k)))) {
modCount++;
size--;
if (prev == e)
table[i] = next;
else
prev.next = next;
e.recordRemoval(this);
return e;
}
prev = e;
e = next;
}
return e;
}
上面的这个过程就是先找到table数组中对应的索引,接着就类似于一般的链表的删除操作,而且是单向链表删除节点,很简单。
clear():
public void clear() {
modCount++;
Entry[] tab = table;
for (int i = 0; i < tab.length; i++)
tab[i] = null;
size = 0;
}
十一、HashMap的3种集合:
1. keySet():获取HashMap所有key的集合。
public Set<K> keySet() {
Set<K> ks = keySet;
return (ks != null ? ks : (keySet = new KeySet()));
}
2. values():获取HashMap所有value的集合。
public Collection<V> values() {
Collection<V> vs = values;
return (vs != null ? vs : (values = new Values()));
}
private final class Values extends AbstractCollection<V> {
public Iterator<V> iterator() {
return newValueIterator();
}
public int size() {
return size;
}
public boolean contains(Object o) {
return containsValue(o);
}
public void clear() {
HashMap.this.clear();
}
}
3. entrySet():获取所有的key-value集合。
public Set<Map.Entry<K,V>> entrySet() {
return entrySet0();
}
private Set<Map.Entry<K,V>> entrySet0() {
Set<Map.Entry<K,V>> es = entrySet;
return es != null ? es : (entrySet = new EntrySet());
}
private final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
public Iterator<Map.Entry<K,V>> iterator() {
return newEntryIterator();
}
public boolean contains(Object o) {
if (!(o instanceof Map.Entry))
return false;
Map.Entry<K,V> e = (Map.Entry<K,V>) o;
Entry<K,V> candidate = getEntry(e.getKey());
return candidate != null && candidate.equals(e);
}
public boolean remove(Object o) {
return removeMapping(o) != null;
}
public int size() {
return size;
}
public void clear() {
HashMap.this.clear();
}
}
十二、与HashTable的异同:
与HashMap数据结构类似的,还有HashTable。
相同点:
1. 数据整体结构:都是Entry类链表组成的数组。
2. 实现接口:都实现了Map接口。
3. 判断元素是否存在的方法:都有判断元素是否被包含的方法。
4. 默认装载因子:都为0.75。
不同点:
1. 线程安全性:HashMap是HashTable的轻量级实现,HashMap是非线程安全的(异步的),而HashTable是线程安全的(同步的)。
2. 对key为null的限制:HashMap允许存储一个key为null的元素,而HashTable不允许存储key为null的元素。
3. 数组默认大小不同:HashMap默认大小为16,而HashTable默认大小为11。
4. 遍历元素方法不同:HashMap使用Iterator迭代器接口实现,而HashTable使用的是Enumeration接口实现。
5. 数组容量增长方式不同:HashMap增长为原来的2倍,HashTable增长为原来值 * 2 +1。
在JDK1.8中HashMap的put方法执行过程:
①.判断键值对数组table[i]是否为空或为null,否则执行resize()进行扩容;
②.根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③;
③.判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals;
④.判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤;
⑤.遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;
⑥.插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold,如果超过,进行扩容。
相关推荐
Java Development Kit (JDK) 1.6 是Java编程语言的一个早期版本,它包含了Java运行时环境(JRE)、编译器(javac)和其他开发工具。深入理解JDK 1.6的源码对于Java开发者来说至关重要,因为它揭示了语言核心库的工作...
Java Development Kit (JDK) 1.6是Java编程语言的一个重要版本,它包含了一系列的开发工具和Java运行环境。API(Application Programming Interface)是JDK的核心部分,提供了丰富的类库供开发者使用,以实现各种...
Java开发工具JDK1.6源码的获取与分析对于深入理解Java语言的内部机制、优化编程技巧以及排查问题有着至关重要的作用。源码能够揭示出API背后的实现细节,帮助开发者提升技能,增强代码质量。以下将详细介绍如何在...
**Java Development Kit (JDK) 1.6 源码包详解** JDK 1.6源码包是Java编程语言的核心开发工具集,它包含了大量的类库和工具,为开发者提供了深入理解Java平台工作原理的机会。源码包允许程序员查看并研究Java API的...
**JDK 1.6 源码详解** JDK(Java Development Kit)1.6,也被称为Java SE 6,是Oracle公司发布的Java平台标准版的一个重要版本。这个版本的发布为Java开发者提供了大量的新特性和改进,使得Java编程更加高效、安全...
2. **集合框架**:JDK1.6进一步完善了集合框架,包括List、Set、Map等接口及其实现类,如ArrayList、LinkedList、HashSet、HashMap等。这些类提供了丰富的操作方法,使得数据组织和管理更为便捷。 3. **IO流**:JDK...
JDK1.6的集合框架是Java开发中的重要组成部分,包括List、Set、Map等接口以及ArrayList、LinkedList、HashSet、HashMap等实现类。这些集合类提供了丰富的数据存储和操作功能,例如添加、删除、查找元素,以及对集合...
首先,JDK1.6中文帮助文档是Java开发过程中的一大利器,尤其对于中文使用者来说,阅读中文文档无疑降低了理解难度,使得学习过程更为顺畅。文档详尽地介绍了Java平台标准版(Java SE)1.6版本的各种类库、接口、方法...
Java 1.6的IO流增加了NIO(Non-blocking I/O)支持,提供了一种异步I/O处理方式,提升了性能。BufferedReader和BufferedWriter用于字符流的缓冲,FileInputStream和FileOutputStream处理文件的字节流,而...
JDK1.6,也被称为Java SE 6,是Java历史上的一个重要版本,发布于2006年,为开发者提供了丰富的API和性能优化。本源代码包包含的就是这个版本的所有源码,对于理解Java语言底层实现、学习API设计以及深入研究Java...
在本案例中,我们讨论的是JDK 1.6版本,这是一个较早但仍然在许多系统中使用的版本。 **Java环境配置**是使用Java技术的第一步。在Windows操作系统中,配置通常包括设置`JAVA_HOME`环境变量指向JDK的安装目录,然后...
JDK1.6是Java历史上的一个重要版本,它引入了许多改进和新特性,对提升开发效率和程序性能有着显著作用。以下是JDK1.6 API中的一些核心知识点: 1. **基础类库**:包括了`java.lang`、`java.util`、`java.io`等基础...
JDK 1.6,也称为 Java Development Kit 1.6 或 Java SE 6,是Oracle公司发布的一个重要的Java平台版本,它在Java 1.5的基础上进行了一系列的改进和增强。这个版本的API带索引功能,使得开发者能够更快速、更有效地...
Java JDK1.6是Oracle公司发布的Java开发工具包的一个重要版本,主要用于Java应用程序的开发和运行。这个绿色版指的是无需安装,解压后即可在操作系统上直接使用的版本,方便开发者在不同环境间快速切换或者在没有...
JDK 1.6相比前一版本有许多增强和新特性,例如: 1. **增强型for循环(foreach)**: 针对集合类的迭代简化了代码,如`for (Element e : collection) { ... }`。 2. **枚举类型(enum)**: 引入了枚举作为关键字,...
Java JDK1.6学习笔记是一份详实的资料,涵盖了Java开发工具集(JDK)1.6版本的核心概念和技术。这份笔记对于Java初学者以及有一定经验的开发者来说都是一份宝贵的参考资料,它可能包含了从基础语法到高级特性的讲解...
12. **集合框架**:JDK1.6中的集合框架是`java.util`包的一大亮点,包括List、Set、Map接口,以及ArrayList、LinkedList、HashSet、HashMap等实现类。 13. **注解(Annotation)**:JDK1.6引入了注解,这是一种元...
JDK 1.6是Oracle公司发布的Java SE(Standard Edition)的一个版本,它为开发者提供了丰富的API(Application Programming Interface)接口,使得开发人员能够构建高效、稳定且跨平台的Java应用程序。 **一、核心...
这个中文版的JDK1.6 API帮助文档是学习和理解Java 1.6版本编程的关键资源,对于初学者和有经验的开发者来说都是一个实用的学习和查询工具。 首先,API文档中的核心部分是Java类库,这些类库包括了基础类如`Object`...
通过分析JDK1.6的rt.jar源码,我们可以深入了解Java平台的工作原理,提高代码质量和性能。然而,随着Java版本的更新,新的特性和优化不断引入,对新版本的源码学习同样至关重要。开发者应持续关注Java的发展,以便更...