`
yuanc00
  • 浏览: 30032 次
社区版块
存档分类
最新评论

Java HashMap 源代码学习

    博客分类:
  • java
 
阅读更多

注:这里使用的是java 1.6版本。

1.HashMap继承AbstractMap,实现Map、Cloneable、Serializable接口;


2.HashMap的内部是通过数组实现的;
    2-1 HashMap的内部结构

    /**
     * The table, resized as necessary. Length MUST Always be a power of two.
     */
    transient Entry[] table;

 
    2-2 Entry的定义:

    static class Entry<K,V> implements Map.Entry<K,V> {
        final K key;
        V value;
        Entry<K,V> next;
        final int hash;

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry<K,V> n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }

 
    Entry是一个链表结构;
    对于一个Map中的对象,对应一个Entry;
    默认初始的table大小为16,最大为1<<30,即1073741824。

 

3. HashMap的初始化方法。

一共有四种:

    HashMap (int initiaCapacity, float loadFactor);

    HashMap (int initialCapacity);

    HashMap();

    HashMap (Map<? Extends K, ? extends V> map);

    前面三个仅仅是指定HashMap的基本参数,比如容量(capacity),扩展因子(loadFactor);第四种是通过一个已经定义的Map对HashMap进行初始化,具体的方法是通过putAllForCreate()完成。

    3-1 HashMap的Map初始化

    public HashMap(Map<? extends K, ? extends V> m) {
        this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,
                      DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);
        putAllForCreate(m);
    }

 
    这里首先是申请新的内存空间,新建对象;
    然后在putAllForCreate()方法中,通过迭代器的循环,将参数map中的结果写入;
    结果的写入通过putForCreate(K k, V v)方法完成。
    3-2 HashMap的Entry插入方法

    private void putForCreate(K key, V value) {
        int hash = (key == null) ? 0 : hash(key.hashCode());
        int i = indexFor(hash, table.length);

        /**
         * Look for preexisting entry for key.  This will never happen for
         * clone or deserialize.  It will only happen for construction if the
         * input Map is a sorted map whose ordering is inconsistent w/ equals.
         */
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k)))) {
                e.value = value;
                return;
            }
        }

        createEntry(hash, key, value, i);
    }

 
    在putForCreate(K k, V v)方法中,首先获取新对象的hash值,计算该hash在table数组中的位置;然后检查该对象是否已经存在,如果存在,则插入失败;否则进行插入。
    插入方法在createEntry中进行:
    3-3 createEntry方法

    void createEntry(int hash, K key, V value, int bucketIndex) {
	Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
        size++;
    }

 
    可以看到,新的元素将在链表的头部被插入。
    同时,注意到HashMap中,size表示的是Entry对象的数量;而不是table数组的长度,即table.length

4.这里有个比较巧妙的地方,即hash方法的实现以及通过hash和table长度快速定位Entry在table数组中的位置。
    Hash方法是通过移位操作完成的。如下:
    4-1 HashMap的hash方法

    /**
     * Applies a supplemental hash function to a given hashCode, which
     * defends against poor quality hash functions.  This is critical
     * because HashMap uses power-of-two length hash tables, that
     * otherwise encounter collisions for hashCodes that do not differ
     * in lower bits. Note: Null keys always map to hash 0, thus index 0.
     */
    static int hash(int h) {
        // This function ensures that hashCodes that differ only by
        // constant multiples at each bit position have a bounded
        // number of collisions (approximately 8 at default load factor).
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

    /**
     * Returns index for hash code h.
     */
    static int indexFor(int h, int length) {
        return h & (length-1);
    }

 
5.Get方法
    很简单,如下:

    public V get(Object key) {
        if (key == null)
            return getForNullKey();
        int hash = hash(key.hashCode());
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k)))
                return e.value;
        }
        return null;
    }

 
    当输入的key为null时,从table[0]中返回key为null时的结果;(getForNullKey())。
    当key为非null时,遍历对应的链表,直到找到符合条件的Entry;如果链表遍历完成之后还没有找到,则返回空结果null。
    需要说明的是,对于hash方法,不同的入参,有可能得到相同的结果,这就是所谓的“hash碰撞”。理想地,hash算法设计的目的,就是尽量减少碰撞的现象,使经过hash计算之后,结果尽量地分散,这样才能保证hash的效率最好。一种极端的情况是,所有的对象,hash的结果都相同,这种情况下,Map就退化成了链表,查询效率将大大下降。

6.containsKey方法
    public boolean containsKey(Object key);
    这其实也就是一种查询,除了对key进行检查之外,执行的方法和get方法一致。

7.put方法
    代码如下:

    public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key.hashCode());
        int i = indexFor(hash, table.length);
        for (Entry<K,V> e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

 
    对于key为null的情况,将更新table[0]链表中,key为null的Entry;如果已经存在一个key为入参的entry,则更新这个entry,然后将旧的值返回;如果不存在这样的Entry,则插入一个。插入的方法为addEntry,后续马上进行说明;(putForNullKey())。
    当key不为null的时候,先进行查找。通过key查找Entry,如果找到,则更新Entry的value,然后将旧的value返回;如果没有找到,则新增一个Entry。
    新增Entry通过addEntry方法完成。同样是通过头部插入,新的结果被放在链表的头部。与createEntry方法不同的是,这里需要进行一次扩容判断,如果满足要求,则进行一次扩容。
    addEntry方法如下:

    void addEntry(int hash, K key, V value, int bucketIndex) {
	Entry<K,V> e = table[bucketIndex];
        table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
        if (size++ >= threshold)
            resize(2 * table.length);
    }

 
    扩容的条件是,当前HashMap的大小达到了阈值的设置(阈值的计算:threshold=capacity*loadFactor);扩容是将table的长度扩展为原来的两倍。
    Resize方法如下:

    void resize(int newCapacity) {
        Entry[] oldTable = table;
        int oldCapacity = oldTable.length;
        if (oldCapacity == MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return;
        }

        Entry[] newTable = new Entry[newCapacity];
        transfer(newTable);
        table = newTable;
        threshold = (int)(newCapacity * loadFactor);
    }

 
    Resize方法,会重新申请新的内存保存新的结果,老的table数组将会被回收。
    这里,如果旧的table的容量已经达到了设置的上限(2<<30),则新的table的threshold将会设置为最大整数值,这意味着,后续不能进行扩容了。

    将旧的结果重新设置到新的table中的过程在transfer中完成。

    void transfer(Entry[] newTable) {
        Entry[] src = table;
        int newCapacity = newTable.length;
        for (int j = 0; j < src.length; j++) {
            Entry<K,V> e = src[j];
            if (e != null) {
                src[j] = null;
                do {
                    Entry<K,V> next = e.next;
                    int i = indexFor(e.hash, newCapacity);
                    e.next = newTable[i];
                    newTable[i] = e;
                    e = next;
                } while (e != null);
            }
        }
    }

 

    整个过程相当于,遍历一次所有的旧的table,以及table中每个链表的元素;然后重新写入新的table中——同样是头部插入。

    这是个非常耗时的操作,所以为了性能考虑,尽量在初始化的时候,设置好合理的capacity和loadFactor,尽量避免这个方法的执行。

    在最后,modCount完成一次自增操作;modCount用来记录HashMap的结构性变化的次数;在同步操作的时候用到,使失败尽可能早的发生(ConcurrentModificationException)。

    同时,在put的时候,返回结果为旧的value;如果旧的value不存在,直接返回null。

 

8. putAll方法

    public void putAll (Map<? Extends K, ? extends V> map);

    将入参的map的结果全部插入HashMap中。

    主要的做法就是检查容量,是否需要进行扩容;

    然后通过循环,将map中的Entry对象通过循环写入。


9.remove方法
    将一个元素HashMap中删除。
    返回结果是被删除的Entry的值(value)。
    通过removeEntryForKey方法完成。

    final Entry<K,V> removeEntryForKey(Object key) {
        int hash = (key == null) ? 0 : hash(key.hashCode());
        int i = indexFor(hash, table.length);
        Entry<K,V> prev = table[i];
        Entry<K,V> e = prev;

        while (e != null) {
            Entry<K,V> next = e.next;
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k)))) {
                modCount++;
                size--;
                if (prev == e)
                    table[i] = next;
                else
                    prev.next = next;
                e.recordRemoval(this);
                return e;
            }
            prev = e;
            e = next;
        }

        return e;
    }

 
    这是一个简单的链表删除的操作;这里就不进行赘述了。
    不过需要注意,在HashMap的范围中进行变量的操作,比如modCount和size。

10.removeMapping
    删除一个映射;相当于删除一个Entry,不过这个Entry传入的时候,类型进行了向上扩展,变成了Object。
    操作的方法和removeEntryForKey一致。

11.clear方法
    清理HashMap中Entry。
    clear方法

    public void clear() {
        modCount++;
        Entry[] tab = table;
        for (int i = 0; i < tab.length; i++)
            tab[i] = null;
        size = 0;
    }

 
    主要是将所有的引用置空,除了modCount和size,其他的参数设置不变

12.containsValue方法
    判断HashMap中是否含有value。

    public boolean containsValue(Object value) {
	if (value == null)
            return containsNullValue();

	Entry[] tab = table;
        for (int i = 0; i < tab.length ; i++)
            for (Entry e = tab[i] ; e != null ; e = e.next)
                if (value.equals(e.value))
                    return true;
	return false;
    }

 
    这也相当于一次遍历,如果HashMap的Entry很多的话,效率会很差;慎用

13.其他辅助访问对象
    为了便于HashMap的遍历,在HashMap的类中,还定义了一些辅助的访问类。比如ValueIterator、KeyIterator、EntryIterator、HashIterator、entrySet、KeySet等等,这里就不一一列举了。
    同时,为了支持序列化,HashMap也实现了readObject和writeObject方法。

 

 

 

分享到:
评论

相关推荐

    java代码-使用java解决手写hashMap的源代码

    java代码-使用java解决手写hashMap的源代码 ——学习参考资料:仅用于个人学习使用!

    Java HashMap类详解

    HashMap 的存储实现可以通过查看其 put(K key, V value) 方法的源代码来了解。该方法首先判断 key 是否为 null,然后根据 key 的 hashCode 值计算 Hash 值,接着搜索指定 hash 值在对应 table 中的索引,如果 i 索引...

    164个完整的Java程序源代码

    这个资源包含164个完整的Java程序源代码,这对于学习Java编程或者提升编程技能来说,是一个非常宝贵的学习材料。以下是一些基于这些源代码可能涉及的知识点的详细说明: 1. **基础语法**:源代码中会涵盖Java的基础...

    java8源代码内容

    综上所述,Java 8源代码对于学习和理解这些新特性的实现机制非常有价值。通过阅读源代码,开发者可以深入了解内部的工作原理,提升编程技能,并能够更好地利用Java 8的功能来解决实际问题。与Eclipse等IDE配合使用,...

    Java核心源代码

    Java核心源代码是Java编程语言的核心组成部分,它包括了大量的类库和API,这些构成了Java开发的基础框架。在Java中,"以java开头的包"通常指的是Java标准库,这是一个庞大的集合,涵盖了各种功能,从基本的数据类型...

    Java全部源代码

    Java源代码包含了JDK(Java Development Kit)的所有组件,包括核心类库如java.lang、java.util、java.io等,这些类库构成了Java平台的基础。通过阅读源代码,我们可以了解到Java的API是如何实现的,比如对象的创建...

    java源代码,java源代码

    Java源代码是编程世界的基石,它是Java程序员用Java语言编写的程序文本,包含了...对于压缩包中的"java源码",可能是某个具体项目或库的源代码,通过阅读和学习,我们可以深入了解其设计思路和实现方式,提升编程技能。

    java简单实例程序源代码

    在Java编程语言的学习过程中,实例程序是理解和掌握概念的关键。"java简单实例程序源代码"这个压缩包包含了一系列章节相关的Java实例源代码,...同时,这种按章节组织的源代码结构也有助于系统性地学习和复习Java编程。

    JAVA 经典源代码

    在IT领域,尤其是Java编程语言的学习与开发过程中,掌握经典源代码是提升技能的重要途径。"JAVA 经典源代码"这个主题包含了丰富的知识内容,它涵盖了基础语法、设计模式、数据结构、算法等多个方面。这里我们将深入...

    JAVA开发源代码

    【JAVA开发源代码】是一个与Java编程相关的学习资源,它可能包含了从项目构思到最终实现的完整开发过程。虽然描述中提到的是一个简洁的20字概述,但我们可以深入探讨Java开发的一些关键知识点。 首先,Java是一种...

    JAVA程序源代码学习借鉴

    这份名为"JAVA程序源代码学习借鉴"的压缩包文件显然旨在帮助初学者或有经验的开发者提升他们的Java技能。让我们深入探讨一下这个资源可能包含的知识点,以及如何有效地利用它来学习和进步。 首先,源代码是程序的...

    java api源代码

    在Java API源代码中,我们可以找到许多关键的类,如`Object`、`String`、`ArrayList`、`HashMap`等。这些类是Java程序设计的基石,它们的实现细节对于优化代码性能,理解和解决运行时问题具有重要意义。 1. `Object...

    达内java学习源代码

    "达内java学习源代码"很可能是达内教育机构提供的Java教学课程中的实践项目或示例代码集合,旨在帮助学员深入理解Java编程概念并提升实际编程技能。 达内的Java培训通常涵盖以下几个关键知识点: 1. **Java基础**...

    疯狂JAVA讲义源代码光盘内容.rar

    这份压缩包"疯狂JAVA讲义源代码光盘内容.rar"包含了书中提到的所有代码示例,是学习Java编程的重要参考资料。 首先,我们来了解一下Java编程语言的基础知识。Java是一种面向对象的编程语言,由Sun Microsystems(后...

    Java自学程序源代码

    Java自学程序源代码是初学者和进阶者深入理解编程语言的重要资源,它提供了一手的实践材料,帮助学习者通过实例来探索和掌握Java语言的核心概念和特性。以下是一些关键的知识点,这些知识点可以从这个"Java自学程序...

    java代码学习代码

    在"workspace"这个文件夹中,通常会包含开发项目的源代码、资源文件、配置文件等。学习过程中,可以参考这些实际代码来加深理解,通过阅读和实践来巩固Java编程技能。同时,不断实践和解决实际问题,是提升编程能力...

    250个java源代码

    这些源代码实例涵盖了Java的基础概念到进阶特性,是学习和理解Java语法、编程技巧以及解决问题的有效工具。 首先,Java源代码的学习应从基础语法开始。这可能包括变量声明、数据类型(如基本类型和引用类型)、控制...

    java源代码学习仓库

    Java源代码学习仓库是一个专为Java开发者准备的学习资源集合,其中包含了各种Java相关的源代码示例,涵盖了软件开发和插件实现的多个方面。通过深入研究这个仓库中的代码,开发者可以提升自己的编程技能,理解Java...

    java 开发源代码

    在Java中,源代码通常以.java文件的形式存在,经过Java编译器转换成字节码(.class文件),然后由Java虚拟机(JVM)执行。 "Java 开发源代码"这个主题涵盖了多个Java语言和开发过程中的关键知识点。首先,理解Java...

Global site tag (gtag.js) - Google Analytics