`
javandroid
  • 浏览: 25628 次
  • 性别: Icon_minigender_1
文章分类
社区版块
存档分类
最新评论

HashMap源码分析

 
阅读更多

版本说明:jdk1.7.0_79

HashMap实现原理


HashMap中有一个Entry,它是HashMap的静态内部类。通过声明可以知道,它实际上就类似于一个链表,链表中的元素就是<K,V>,还有个next指向下一个Entry节点。

static class Entry<K,V> implements Map.Entry<K,V> {
    final K key;
    V value;
    Entry<K,V> next;
    int hash;
    ……
}
在HashMap的实现中,有一个桶(bucket)的概念:对于Entry数组而言,数组的每个元素存储的是链表,而不是直接的Value。在链表中的每个元素才是真正的<Key, Value>。而一个链表对应一个桶!

属性

    //默认初始容量,16
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    //最大容量    
    static final int MAXIMUM_CAPACITY = 1 << 30;
    //默认负载因子,0.75
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
        
    static final Entry<?,?>[] EMPTY_TABLE = {};
    //【核心】HashMap的底层实现
    transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;
    //元素数量
    transient int size;
    //阈值(容量*加载因子):当达到该值时,会进行rehash  
    int threshold;
    //负载因子(size/数组长度。当负载情况达到该值时,自动增加数组的容量,并进行再散列(重新将现有对象分布到容器中))        
    final float loadFactor;
    //修改次数       
    transient int modCount;
    
    static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;


构造方法

public HashMap(int initialCapacity, float loadFactor)
public HashMap(int initialCapacity)
public HashMap()
public HashMap(Map<? extends K, ? extends V> m)
在初始化HashMap时,可以指定其初始化容量,和负载因子。如果不指定,则使用定义的默认值。默认初始容量为16,默认负载因子为0.75。

put方法

public V put(K key, V value) {
    //map为空表时,进行扩充
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    //如果key为null,直接定位到table[0]处,进行处理
    if (key == null)
        return putForNullKey(value);
    //计算key的hash值
    int hash = hash(key);
    //根据key的hash,定位key在table中索引
    int i = indexFor(hash, table.length);
    //判断key是否存在
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {
        Object k;
        //如果key已存在,则覆盖原value
        //【判断key相等】:也就是判断两个Object是否相等
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            //返回旧值(方法返回后,可能还要用到旧值)
            return oldValue;
        }
    }//key不存在       
    //修改次数+1
    modCount++;
    //添加<k,v>
    addEntry(hash, key, value, i);
    return null;
}

get方法

public V get(Object key) {
    //key为null和非null分别对应table数组的索引为0和非0位置。两种情况分开处理。
    //如果key为null
    if (key == null)
        return getForNullKey();
    //key非null时
    Entry<K,V> entry = getEntry(key);
    //返回key对应value值
    return null == entry ? null : entry.getValue();
}

private V getForNullKey() {
    if (size == 0) {
        return null;
    }
    //遍历下标为0处的Entry(类似链表),查找key
    for (Entry<K,V> e = table[0]; e != null; e = e.next) {
        //key存在,返回对应value值
        if (e.key == null)
            return e.value;
    }
    //不存在,返回null
    return null;
}

final Entry<K,V> getEntry(Object key) {
    if (size == 0) {
        return null;
    }
    //计算key的hash。如果key为null,则hash为0
    int hash = (key == null) ? 0 : hash(key);
    //通过hash定位key在数组中的下标。遍历所在下标处的Entry(链表结构),查找key
    for (Entry<K,V> e = table[indexFor(hash, table.length)];
         e != null;
         e = e.next) {
        Object k;
        //如果key存在,返回该Entry
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))
            return e;
    }
    //key不存在,返回null
    return null;
}
实际上,如果能将put方法搞清楚了,get方法就基本是alittle case.


哈希函数的构造方法(计算hash的方法)

1.直接地址法

2.数字分析法

3.平方取中法

4.折叠法

5.除留余数法

这是最简单,也是最常用的构造hash函数的方法。

常用的处理冲突的方法

1.开放地址法

2.再哈希法

产生冲突时,使用其它的哈希构造函数计算得到另一个地址,如果再冲突,再换个哈希函数再计算,直到冲突不再发生。这种方法不易产生“聚集”,但增加了计算的时间。

3.链地址法

在链表中的插入位置可以在表头,表中,也可以在中间。

4.建立一个公共的溢出区


HashMap使用的就是链地址法,插入位置在表头

    void createEntry(int hash, K key, V value, int bucketIndex) {
        Entry<K,V> e = table[bucketIndex];
        //创建一个Entry,并插入到表头
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        size++;
    }

总结

搞清楚下面几个问题,HashMap的知识就算完全掌握了。

1.HashMap的特点和工作原理?

2.碰撞如何处理?

处理冲突的方式很多,HashMap使用链地址法来处理冲突

3.hashCode相同,对象是否相等?对象相等,是否有相同的hashCode?

hashCode相同,则会继续使用key的equals()方法来比较对象。所以hashCode相同,对象不一定相等。

对象相等,通过同一个hash函数当然得到的结果是一样的。所以对象相等,hashCode也一定相等。

4.HashMap的负载因子(load factor)作用是什么?如果容量达到阈值,怎么办?

随着越来越多的元素添加到HashMap,发生碰撞的情况也越来越多,链表可能会越来越长。而为了防止这种情况,所以设置了一个负载因子。

HashMap默认的负载因子是0.75。默认初始容量为16,也就是说达到12个元素时,就会达到阈值了。此时将table扩容到原来的2倍,并重新计算key的hash并将该元素添加到新的bucket位置中。

5.HashMap会有什么安全问题?

①两个线程同时添加元素时,存在竞态条件。

如下,我们希望一个线程执行添加成功,另一个线程再添加时发现已存在,就不再添加。但实际情况可能是:当两个线程同时执行if条件时,都发现没有key,所以都执行了大括号内的代码,显然不安全。

if(!map.containsKey(key))
{
   map.put(key,value);
   return true;  
}

②两个线程同时添加元素时,都发现容量已经达到阈值,都需要进行扩容。扩容时会将原有的所有元素移动到新的table中。两个线程同时进行移动操作,显然会产生不安全的问题。

    void resize(int newCapacity) {
    	//暂存旧table
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        
        //旧容量达到了规定的最大容量值,则将阈值提高到Integer取值范围的最大值
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        //构建新table(容量为newCapacity)
        Entry[] newTable = new Entry[newCapacity];
        //将旧table中的全部数据转移到新table中
        transfer(newTable, initHashSeedAsNeeded(newCapacity));
        table = newTable;
        
        //新table的阈值也相应的增大(但该值不能超过MAXIMUM_CAPACITY + 1)
        threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);
    }
等等,不一而足。

6.为什么String,Integer这样的包装类适合作为HashMap的键?

HashMap是使用key的hash来定位位置的,如果我们做put操作后,对象发生了变化导致其hash发生变化,当我们再次做get操作时,定位显然可能就变了,结果就是该key不存在。

如下,当MyClass作为key时,如果put之前a=b=0,put完后,我们将a=b=1,显然hashCode就变了

public class MyClass {
	int a;
	int b;
	@Override
	public int hashCode() {
		final int prime = 31;
		int result = 1;
		result = prime * result + a;
		result = prime * result + b;
		return result;
	}
}

String,Integer都是final类型的,对象不会发生变化,也就不用担心put和get时hashcode不一致的问题。

7.如果使用自定义的对象来作为key,要注意些什么?

通过上一个问题,我们已经很明确了。①只要自定义的对象做put操作后不再发生变化就能用来作为key。当然使用时一定要小心,很容易疏忽而发生危险!

当然还要注意一点,通常情况下,对于自定义的对象来作为key,我们要同时覆盖hashCode()方法和equals()方法

Java 用自定义类型作为HashMap的键

8.ConcurrentHashMap和Hashtable有什么区别?

HashMap是非线程安全的,而Hashtable则是线程安全的。但是Hashtable使用的synchronized来实现同步,而ConcurrentHashMap则使用分段锁来实现线程同步,锁的粒度更细,所以ConcurrenttHashMap性能比HashTable更好。所以Hashtable也逐渐被遗弃。

分享到:
评论

相关推荐

    1.面试必考之HashMap源码分析与实现 伸缩性角度看HashMap的不足

    1.面试必考之HashMap源码分析与实现 伸缩性角度看HashMap的不足

    面试必考之HashMap源码分析与实现

    面试中,HashMap的源码分析与实现是一个常见的考察点,因为它涉及到数据结构、并发处理和性能优化等多个核心领域。本篇文章将深入探讨HashMap的内部工作原理、关键特性以及其在实际应用中的考量因素。 HashMap基于...

    HashMap 源码分析

    《HashMap 源码解析——JDK11版本》 HashMap是Java中广泛使用的非同步散列表,其设计和实现是高效且灵活的。在JDK1.8之前,HashMap的底层数据结构采用的是数组+链表的方式,这种方式称为“拉链法”来解决哈希冲突。...

    HashMap源码分析-思维导图.xmind

    hashmap的原理啊思想。

    HashMap源码分析系列-第四弹:HashMap多线程解决方案.docx

    #### 二、HashMap线程安全问题分析 在多线程环境中,`HashMap`的主要线程安全问题包括但不限于: 1. **链表死循环问题**:在JDK 1.7中,当多个线程同时进行`put`操作时,可能会出现链表死循环的情况,这是一个严重...

    Java集合系列之HashMap源码分析

    Java集合系列之HashMap源码分析 Java集合系列之HashMap源码分析是Java集合系列中的一篇非常重要的文章,它详细介绍了Java集合系列之HashMap源码,具有很高的参考价值。下面我们将对HashMap源码进行详细的分析。 ...

    hashmap实现原理

    哈希映射(HashMap)是Java编程语言中广泛使用的数据结构之一,主要提供键值对的存储和查找功能。HashMap的实现基于哈希表的概念,它通过计算对象的哈希码来快速定位数据,从而实现了O(1)的平均时间复杂度。在深入...

    Java高级面试第二套1.面试必考之HashMap源码分析与实现

    微信小程序详细图文教程 泉州大白网络科技 目录 一.微信小程序申请 二....1.申请服务器 2.部署服务器 3.域名申请和配置 三....一....申请,并认证(未认证不能发布,认证需要300元,目前只支持企业认证)详细见官网说明。...

    JAVA之hashmap源码分析-Mobile-Dev-Analysis:android或java的分析

    JAVA之hashmap源码分析 Mobile-Dev-Analysis Analysis of android or java 红岩网校工作站移动开发部学员分组学习 为了让大家学的更加坚固,采取小组学习的方式帮助大家学习,同时在学习研究的过程中需要不断的做...

    JAVA之hashmap源码分析-haha:已弃用的Java库可自动分析Android堆转储

    JAVA之hashmap源码分析 无头Android堆分析器 “哈哈!” -纳尔逊 此存储库已弃用 创建该项目的目的是通过重新打包其他存储库中的堆转储解析器来提供堆转储解析器。 LeakCanary现在有它自己的。 该解析器在Maven ...

    JAVA之hashmap源码分析-superword:Superword是一个Java开源项目,致力于英语单词分析和辅助阅读的研究

    JAVA之hashmap源码分析Superword是Java开源项目,致力于研究英语单词分析和辅助阅读,包括但不限于拼写相似度,定义相似度,发音相似度,拼写转换规则,前缀和动态前缀,后缀以及动态后缀,词根,复合词,文本辅助...

    【死磕Java集合】-集合源码分析.pdf

    四、HashMap源码分析 HashMap是一种基于散列表实现的Map,提供了快速的键值对存储和检索能力。HashMap的继承体系中,它继承了AbstractMap,实现了Map接口。 HashMap的主要属性包括键值对数组table、键值对个数size...

    Java面试专属视频

    面试必考之HashMap源码分析与实现 ,微服务架构之Spring Cloud Eureka 场景分析与实战,高性能必学之Mysql主从架构实践 ,架构师不得不知道的Spring事物不能回滚的深层次原因 ,分库分表之后分布式下如何保证ID全局...

    Android(Java) 模拟登录知乎并抓取用户信息

    在本文中,我们将深入探讨如何使用Java在Android平台上实现模拟登录知乎并抓取用户信息的过程。... 首先,我们需要了解的是Android的网络访问机制。Android系统为了安全性和用户体验,对网络访问进行了限制,必须在...

    HashMap源码剖析共10页.pdf.zip

    《HashMap源码剖析》 HashMap是Java编程语言中一个非常重要的数据结构,它在实际开发中被广泛应用。作为集合框架的一部分,HashMap实现了Map接口,提供了高效、非同步的键值对存储功能。在这个10页的PDF文档中,...

    手写HashMap源码.rar

    本篇文章将通过分析一个名为"MyHashMap"的手写HashMap源码,来探讨HashMap的内部机制,帮助提升编程能力。 首先,HashMap的核心是基于哈希表的数据结构,它利用键(Key)的哈希函数将键映射到数组的特定位置,从而...

Global site tag (gtag.js) - Google Analytics