`
maosheng
  • 浏览: 564908 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hashtable 的实现原理深入剖析

    博客分类:
  • Java
jdk 
阅读更多
一、Hashtable的基本方法:

1、定义:

HashTable在Java中的定义如下:

public class Hashtable<K,V>
    extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable

从中可以看出HashTable继承Dictionary类,实现Map接口。其中Dictionary类是任何可将键映射到相应值的类(如 Hashtable)的抽象父类。每个键和每个值都是一个对象。在任何一个 Dictionary 对象中,每个键至多与一个值相关联。Map是"key-value键值对"接口。

HashTable采用"拉链法"实现哈希表,它定义了几个重要的参数:table、count、threshold、loadFactor、modCount。

table:为一个Entry[]数组类型,Entry代表了“拉链”的节点,每一个Entry代表了一个键值对,哈希表的"key-value键值对"都是存储在Entry数组中的。

count:HashTable的大小,注意这个大小并不是HashTable的容器大小,而是他所包含Entry键值对的数量。

threshold:Hashtable的阈值,用于判断是否需要调整Hashtable的容量。threshold的值="容量*加载因子"。

loadFactor:加载因子。

modCount:用来实现“fail-fast”机制的(也就是快速失败)。所谓快速失败就是在并发集合中,其进行迭代操作时,若有其他线程对其进行结构性的修改,这时迭代器会立马感知到,并且立即抛出ConcurrentModificationException异常,而不是等到迭代完成之后才告诉你已经出错了。

2、构造方法:

在HashTabel中存在4个构造函数。通过这4个构造函数我们构建出一个我想要的HashTable。

public Hashtable() {
        this(11, 0.75f);
    }

 默认构造函数,容量为11,加载因子为0.75

public Hashtable(int initialCapacity) {
        this(initialCapacity, 0.75f);
    }

用指定初始容量和默认的加载因子 (0.75) 构造一个新的空哈希表。

public Hashtable(int initialCapacity, float loadFactor) {
        //验证初始容量
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        //验证加载因子
        if (loadFactor <= 0 || Float.isNaN(loadFactor))
            throw new IllegalArgumentException("Illegal Load: "+loadFactor);

        if (initialCapacity==0)
            initialCapacity = 1;
       
        this.loadFactor = loadFactor;
       
        //初始化table,获得大小为initialCapacity的table数组
        table = new Entry[initialCapacity];
        //计算阀值
        threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
    }

用指定初始容量和指定加载因子构造一个新的空哈希表。

public Hashtable(Map<? extends K, ? extends V> t) {
        //设置table容器大小,其值==t.size * 2 + 1
        this(Math.max(2*t.size(), 11), 0.75f);
        putAll(t);
    }

构造一个与给定的 Map 具有相同映射关系的新哈希表。


3、主要方法:

 HashTable的API对外提供了许多方法,这些方法能够很好帮助我们操作HashTable,但是这里我只介绍两个最根本的方法:put、get。

(1)首先我们先看put方法:将指定 key 映射到此哈希表中的指定 value。注意这里:键key和值value都不可为空

public synchronized V put(K key, V value) {
        // 确保value不为null
        if (value == null) {
            throw new NullPointerException();
        }

        /*
         * 确保key在table[]是不重复的
         * 处理过程:
         * 1、计算key的hash值,确认在table[]中的索引位置
         * 2、迭代index索引位置,如果该位置处的链表中存在一个一样的key,则替换其value,返回旧值
         */
        Entry tab[] = table;
        int hash = hash(key);    //计算key的hash值
        int index = (hash & 0x7FFFFFFF) % tab.length;     //确认该key的索引位置
        //迭代,寻找该key,替换
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                V old = e.value;
                e.value = value;
                return old;
            }
        }

        modCount++;
        if (count >= threshold) { 
           //如果容器中的元素数量已经达到阀值,则进行扩容操作
            rehash();
            tab = table;
            hash = hash(key);
            index = (hash & 0x7FFFFFFF) % tab.length;
        }

        // 在索引位置处插入一个新的节点
        Entry<K,V> e = tab[index];
        tab[index] = new Entry<>(hash, key, value, e);
        //容器中元素+1
        count++;
        return null;
    }

put方法的整个处理流程是:计算key的hash值,根据hash值获得key在table数组中的索引位置,然后迭代该key处的Entry链表(我们暂且理解为链表),若该链表中存在一个这个的key对象,那么就直接替换其value值即可,否则在将改key-value节点插入该index索引位置处。

Hashtable的扩容操作,在put方法中,如果需要向table[]中添加Entry元素,会首先进行容量校验,如果容量已经达到了阀值,HashTable就会进行扩容处理rehash(),如下:

protected void rehash() {
        int oldCapacity = table.length;
        //元素
        Entry<K,V>[] oldMap = table;

        //新容量=旧容量 * 2 + 1
        int newCapacity = (oldCapacity << 1) + 1;
        if (newCapacity - MAX_ARRAY_SIZE > 0) {
            if (oldCapacity == MAX_ARRAY_SIZE)
                return;
            newCapacity = MAX_ARRAY_SIZE;
        }
       
        //新建一个size = newCapacity 的HashTable
        Entry<K,V>[] newMap = new Entry[newCapacity];

        modCount++;
        //重新计算阀值
        threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);

        table = newMap;
        //将原来的元素拷贝到新的HashTable中
        for (int i = oldCapacity ; i-- > 0 ;) {
            for (Entry<K,V> old = oldMap[i] ; old != null ; ) {
                Entry<K,V> e = old;
                old = old.next;

                int index = (e.hash & 0x7FFFFFFF) % newCapacity;
                e.next = newMap[index];
                newMap[index] = e;
            }
        }
    }

在这个rehash()方法中我们可以看到容量扩大两倍+1,同时需要将原来HashTable中的元素一一复制到新的HashTable中,这个过程是比较消耗时间的,同时还需要重新计算 index 的,毕竟容量已经变了。这里对阀值说明一下:比如初始值11、加载因子默认0.75,那么这个时候阀值threshold=8,当容器中的元素达到8时,HashTable进行一次扩容操作,容量 = 11 * 2 + 1 =23,而阀值threshold=23 * 0.75 = 17,当容器元素再一次达到阀值时,HashTable还会进行扩容操作,依次类推。

(2)get方法就会比较简单,处理过程就是计算key的hash值,判断在table数组中的索引位置,然后迭代链表,匹配直到找到相对应key的value,若没有找到返回null。

public synchronized V get(Object key) {
        Entry tab[] = table;
        int hash = hash(key);
        int index = (hash & 0x7FFFFFFF) % tab.length;
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {
            if ((e.hash == hash) && e.key.equals(key)) {
                return e.value;
            }
        }
        return null;
    }
 

二、Hashtable的三种遍历方式:

import java.util.Enumeration;
import java.util.Hashtable;
import java.util.Iterator;
import java.util.Map;
import java.util.Map.Entry;

public class HashTableTest {

public static void main(String args[]){
Hashtable<String, Integer> table = new Hashtable<String, Integer>();

table.put("zhangsan", 22);
table.put("lisi", 33);
table.put("wangwu", 44);

//[1]Iterator遍历方式1--键值对遍历entrySet()
Iterator<Entry<String, Integer>> iter = table.entrySet().iterator();
while(iter.hasNext()){
Map.Entry<String, Integer> entry = (Map.Entry<String, Integer>)iter.next();
String key = entry.getKey();
int value = entry.getValue();
System.out.println("entrySet:"+key+" "+value);
}

System.out.println("====================================");

//[2]Iterator遍历方式2--key键的遍历
Iterator<String> iterator = table.keySet().iterator();
while(iterator.hasNext()){
String key = (String)iterator.next();
int value = table.get(key);
System.out.println("keySet:"+key+" "+value);
}

System.out.println("====================================");

//[3]通过Enumeration来遍历Hashtable
Enumeration<String> enu = table.keys();
while(enu.hasMoreElements()) {
    System.out.println("Enumeration:"+table.keys()+" "+enu.nextElement());
}
}
}

输出结果:
entrySet:zhangsan 22
entrySet:lisi 33
entrySet:wangwu 44
====================================
keySet:zhangsan 22
keySet:lisi 33
keySet:wangwu 44
====================================
Enumeration:java.util.Hashtable$Enumerator@139a55 zhangsan
Enumeration:java.util.Hashtable$Enumerator@1db9742 lisi
Enumeration:java.util.Hashtable$Enumerator@106d69c wangwu
 

三、Hashtable 部分源码注释:


package java.util; 
import java.io.*; 

public class Hashtable<K,V> 
    extends Dictionary<K,V> 
    implements Map<K,V>, Cloneable, java.io.Serializable


    // 保存key-value的数组。 
    // Hashtable同样采用单链表解决冲突,每一个Entry本质上是一个单向链表 
    private transient Entry[] table; 

    // Hashtable中键值对的数量 
    private transient int count; 

    // 阈值,用于判断是否需要调整Hashtable的容量(threshold = 容量*加载因子) 
    private int threshold; 

    // 加载因子 
    private float loadFactor; 

    // Hashtable被改变的次数,用于fail-fast机制的实现 
    private transient int modCount = 0; 

    // 序列版本号 
    private static final long serialVersionUID = 1421746759512286392L; 

    // 指定“容量大小”和“加载因子”的构造函数 
    public Hashtable(int initialCapacity, float loadFactor) { 
        if (initialCapacity < 0) 
            throw new IllegalArgumentException("Illegal Capacity: "+ 
                                               initialCapacity); 
        if (loadFactor <= 0 || Float.isNaN(loadFactor)) 
            throw new IllegalArgumentException("Illegal Load: "+loadFactor); 

        if (initialCapacity==0) 
            initialCapacity = 1; 
        this.loadFactor = loadFactor; 
        table = new Entry[initialCapacity]; 
        threshold = (int)(initialCapacity * loadFactor); 
    } 

    // 指定“容量大小”的构造函数 
    public Hashtable(int initialCapacity) { 
        this(initialCapacity, 0.75f); 
    } 

    // 默认构造函数。 
    public Hashtable() { 
        // 默认构造函数,指定的容量大小是11;加载因子是0.75 
        this(11, 0.75f); 
    } 


    // 包含“子Map”的构造函数 
    public Hashtable(Map<? extends K, ? extends V> t) { 
        this(Math.max(2*t.size(), 11), 0.75f); 
        // 将“子Map”的全部元素都添加到Hashtable中 
        putAll(t); 
    } 

    public synchronized int size() { 
        return count; 
    } 

    public synchronized boolean isEmpty() { 
        return count == 0; 
    } 

    // 返回“所有key”的枚举对象 
    public synchronized Enumeration<K> keys() { 
        return this.<K>getEnumeration(KEYS); 
    } 

    // 返回“所有value”的枚举对象 
    public synchronized Enumeration<V> elements() { 
        return this.<V>getEnumeration(VALUES); 
    } 

    // 判断Hashtable是否包含“值(value)” 
    public synchronized boolean contains(Object value) { 
        //注意,Hashtable中的value不能是null, 
        // 若是null的话,抛出异常! 
        if (value == null) { 
            throw new NullPointerException(); 
        } 

        // 从后向前遍历table数组中的元素(Entry) 
        // 对于每个Entry(单向链表),逐个遍历,判断节点的值是否等于value 
        Entry tab[] = table; 
        for (int i = tab.length ; i-- > 0 ;) { 
            for (Entry<K,V> e = tab[i] ; e != null ; e = e.next) { 
                if (e.value.equals(value)) { 
                    return true; 
                } 
            } 
        } 
        return false; 
    } 

    public boolean containsValue(Object value) { 
        return contains(value); 
    } 

    // 判断Hashtable是否包含key 
    public synchronized boolean containsKey(Object key) { 
        Entry tab[] = table; 
//计算hash值,直接用key的hashCode代替
        int hash = key.hashCode();   
        // 计算在数组中的索引值
        int index = (hash & 0x7FFFFFFF) % tab.length; 
        // 找到“key对应的Entry(链表)”,然后在链表中找出“哈希值”和“键值”与key都相等的元素 
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { 
            if ((e.hash == hash) && e.key.equals(key)) { 
                return true; 
            } 
        } 
        return false; 
    } 

    // 返回key对应的value,没有的话返回null 
    public synchronized V get(Object key) { 
        Entry tab[] = table; 
        int hash = key.hashCode(); 
        // 计算索引值, 
        int index = (hash & 0x7FFFFFFF) % tab.length; 
        // 找到“key对应的Entry(链表)”,然后在链表中找出“哈希值”和“键值”与key都相等的元素 
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { 
            if ((e.hash == hash) && e.key.equals(key)) { 
                return e.value; 
            } 
        } 
        return null; 
    } 

    // 调整Hashtable的长度,将长度变成原来的2倍+1
    protected void rehash() { 
        int oldCapacity = table.length; 
        Entry[] oldMap = table; 

//创建新容量大小的Entry数组
        int newCapacity = oldCapacity * 2 + 1; 
        Entry[] newMap = new Entry[newCapacity]; 

        modCount++; 
        threshold = (int)(newCapacity * loadFactor); 
        table = newMap; 

//将“旧的Hashtable”中的元素复制到“新的Hashtable”中
for (int i = oldCapacity ; i-- > 0 ;) { 
            for (Entry<K,V> old = oldMap[i] ; old != null ; ) { 
                Entry<K,V> e = old; 
                old = old.next; 
//重新计算index
                int index = (e.hash & 0x7FFFFFFF) % newCapacity; 
                e.next = newMap[index]; 
                newMap[index] = e; 
            } 
        } 
    } 

    // 将“key-value”添加到Hashtable中 
    public synchronized V put(K key, V value) { 
        // Hashtable中不能插入value为null的元素!!! 
        if (value == null) { 
            throw new NullPointerException(); 
        } 

        // 若“Hashtable中已存在键为key的键值对”, 
        // 则用“新的value”替换“旧的value” 
        Entry tab[] = table; 
        int hash = key.hashCode(); 
        int index = (hash & 0x7FFFFFFF) % tab.length; 
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { 
            if ((e.hash == hash) && e.key.equals(key)) { 
                V old = e.value; 
                e.value = value; 
                return old; 
                } 
        } 

        // 若“Hashtable中不存在键为key的键值对”,
        // 将“修改统计数”+1 
        modCount++; 
        //  若“Hashtable实际容量” > “阈值”(阈值=总的容量 * 加载因子) 
        //  则调整Hashtable的大小 
        if (count >= threshold) {
           rehash();

            tab = table; 
            index = (hash & 0x7FFFFFFF) % tab.length; 
        } 

        //将新的key-value对插入到tab[index]处(即链表的头结点)
        Entry<K,V> e = tab[index];        
        tab[index] = new Entry<K,V>(hash, key, value, e); 
        count++; 
        return null; 
    } 

    // 删除Hashtable中键为key的元素 
    public synchronized V remove(Object key) { 
        Entry tab[] = table; 
        int hash = key.hashCode(); 
        int index = (hash & 0x7FFFFFFF) % tab.length; 

        //从table[index]链表中找出要删除的节点,并删除该节点。
//因为是单链表,因此要保留带删节点的前一个节点,才能有效地删除节点
        for (Entry<K,V> e = tab[index], prev = null ; e != null ; prev = e, e = e.next) { 
            if ((e.hash == hash) && e.key.equals(key)) { 
                modCount++; 
                if (prev != null) { 
                    prev.next = e.next; 
                } else { 
                    tab[index] = e.next; 
                } 
                count--; 
                V oldValue = e.value; 
                e.value = null; 
                return oldValue; 
            } 
        } 
        return null; 
    } 

    // 将“Map(t)”的中全部元素逐一添加到Hashtable中 
    public synchronized void putAll(Map<? extends K, ? extends V> t) { 
        for (Map.Entry<? extends K, ? extends V> e : t.entrySet()) 
            put(e.getKey(), e.getValue()); 
    } 

    // 清空Hashtable 
    // 将Hashtable的table数组的值全部设为null 
    public synchronized void clear() { 
        Entry tab[] = table; 
        modCount++; 
        for (int index = tab.length; --index >= 0; ) 
            tab[index] = null; 
        count = 0; 
    } 

    // 克隆一个Hashtable,并以Object的形式返回。 
    public synchronized Object clone() { 
        try { 
            Hashtable<K,V> t = (Hashtable<K,V>) super.clone(); 
            t.table = new Entry[table.length]; 
            for (int i = table.length ; i-- > 0 ; ) { 
                t.table[i] = (table[i] != null) 
                ? (Entry<K,V>) table[i].clone() : null; 
            } 
            t.keySet = null; 
            t.entrySet = null; 
            t.values = null; 
            t.modCount = 0; 
            return t; 
        } catch (CloneNotSupportedException e) {  
            throw new InternalError(); 
        } 
    } 

    public synchronized String toString() { 
        int max = size() - 1; 
        if (max == -1) 
            return "{}"; 

        StringBuilder sb = new StringBuilder(); 
        Iterator<Map.Entry<K,V>> it = entrySet().iterator(); 

        sb.append('{'); 
        for (int i = 0; ; i++) { 
            Map.Entry<K,V> e = it.next(); 
            K key = e.getKey(); 
            V value = e.getValue(); 
            sb.append(key   == this ? "(this Map)" : key.toString()); 
            sb.append('='); 
            sb.append(value == this ? "(this Map)" : value.toString()); 

            if (i == max) 
                return sb.append('}').toString(); 
            sb.append(", "); 
        } 
    } 

    // 获取Hashtable的枚举类对象 
    // 若Hashtable的实际大小为0,则返回“空枚举类”对象; 
    // 否则,返回正常的Enumerator的对象。
    private <T> Enumeration<T> getEnumeration(int type) { 
    if (count == 0) { 
        return (Enumeration<T>)emptyEnumerator; 
    } else { 
        return new Enumerator<T>(type, false); 
    } 
    } 

    // 获取Hashtable的迭代器 
    // 若Hashtable的实际大小为0,则返回“空迭代器”对象; 
    // 否则,返回正常的Enumerator的对象。(Enumerator实现了迭代器和枚举两个接口) 
    private <T> Iterator<T> getIterator(int type) { 
        if (count == 0) { 
            return (Iterator<T>) emptyIterator; 
        } else { 
            return new Enumerator<T>(type, true); 
        } 
    } 

    // Hashtable的“key的集合”。它是一个Set,没有重复元素 
    private transient volatile Set<K> keySet = null; 
    // Hashtable的“key-value的集合”。它是一个Set,没有重复元素 
    private transient volatile Set<Map.Entry<K,V>> entrySet = null; 
    // Hashtable的“key-value的集合”。它是一个Collection,可以有重复元素 
    private transient volatile Collection<V> values = null; 

    // 返回一个被synchronizedSet封装后的KeySet对象 
    // synchronizedSet封装的目的是对KeySet的所有方法都添加synchronized,实现多线程同步 
    public Set<K> keySet() { 
        if (keySet == null) 
            keySet = Collections.synchronizedSet(new KeySet(), this); 
        return keySet; 
    } 

    // Hashtable的Key的Set集合。 
    // KeySet继承于AbstractSet,所以,KeySet中的元素没有重复的。 
    private class KeySet extends AbstractSet<K> { 
        public Iterator<K> iterator() { 
            return getIterator(KEYS); 
        } 
        public int size() { 
            return count; 
        } 
        public boolean contains(Object o) { 
            return containsKey(o); 
        } 
        public boolean remove(Object o) { 
            return Hashtable.this.remove(o) != null; 
        } 
        public void clear() { 
            Hashtable.this.clear(); 
        } 
    } 

    // 返回一个被synchronizedSet封装后的EntrySet对象 
    // synchronizedSet封装的目的是对EntrySet的所有方法都添加synchronized,实现多线程同步 
    public Set<Map.Entry<K,V>> entrySet() { 
        if (entrySet==null) 
            entrySet = Collections.synchronizedSet(new EntrySet(), this); 
        return entrySet; 
    } 

    // Hashtable的Entry的Set集合。 
    // EntrySet继承于AbstractSet,所以,EntrySet中的元素没有重复的。 
    private class EntrySet extends AbstractSet<Map.Entry<K,V>> { 
        public Iterator<Map.Entry<K,V>> iterator() { 
            return getIterator(ENTRIES); 
        } 

        public boolean add(Map.Entry<K,V> o) { 
            return super.add(o); 
        } 

        // 查找EntrySet中是否包含Object(0) 
        // 首先,在table中找到o对应的Entry链表 
        // 然后,查找Entry链表中是否存在Object 
        public boolean contains(Object o) { 
            if (!(o instanceof Map.Entry)) 
                return false; 
            Map.Entry entry = (Map.Entry)o; 
            Object key = entry.getKey(); 
            Entry[] tab = table; 
            int hash = key.hashCode(); 
            int index = (hash & 0x7FFFFFFF) % tab.length; 

            for (Entry e = tab[index]; e != null; e = e.next) 
                if (e.hash==hash && e.equals(entry)) 
                    return true; 
            return false; 
        } 

        // 删除元素Object(0) 
        // 首先,在table中找到o对应的Entry链表
        // 然后,删除链表中的元素Object 
        public boolean remove(Object o) { 
            if (!(o instanceof Map.Entry)) 
                return false; 
            Map.Entry<K,V> entry = (Map.Entry<K,V>) o; 
            K key = entry.getKey(); 
            Entry[] tab = table; 
            int hash = key.hashCode(); 
            int index = (hash & 0x7FFFFFFF) % tab.length; 

            for (Entry<K,V> e = tab[index], prev = null; e != null; 
                 prev = e, e = e.next) { 
                if (e.hash==hash && e.equals(entry)) { 
                    modCount++; 
                    if (prev != null) 
                        prev.next = e.next; 
                    else
                        tab[index] = e.next; 

                    count--; 
                    e.value = null; 
                    return true; 
                } 
            } 
            return false; 
        } 

        public int size() { 
            return count; 
        } 

        public void clear() { 
            Hashtable.this.clear(); 
        } 
    } 

    // 返回一个被synchronizedCollection封装后的ValueCollection对象 
    // synchronizedCollection封装的目的是对ValueCollection的所有方法都添加synchronized,实现多线程同步 
    public Collection<V> values() { 
    if (values==null) 
        values = Collections.synchronizedCollection(new ValueCollection(), 
                                                        this); 
        return values; 
    } 

    // Hashtable的value的Collection集合。 
    // ValueCollection继承于AbstractCollection,所以,ValueCollection中的元素可以重复的。 
    private class ValueCollection extends AbstractCollection<V> { 
        public Iterator<V> iterator() { 
        return getIterator(VALUES); 
        } 
        public int size() { 
            return count; 
        } 
        public boolean contains(Object o) { 
            return containsValue(o); 
        } 
        public void clear() { 
            Hashtable.this.clear(); 
        } 
    } 

    // 重新equals()函数 
    // 若两个Hashtable的所有key-value键值对都相等,则判断它们两个相等 
    public synchronized boolean equals(Object o) { 
        if (o == this) 
            return true; 

        if (!(o instanceof Map)) 
            return false; 
        Map<K,V> t = (Map<K,V>) o; 
        if (t.size() != size()) 
            return false; 

        try { 
            // 通过迭代器依次取出当前Hashtable的key-value键值对 
            // 并判断该键值对,存在于Hashtable中。 
            // 若不存在,则立即返回false;否则,遍历完“当前Hashtable”并返回true。 
            Iterator<Map.Entry<K,V>> i = entrySet().iterator(); 
            while (i.hasNext()) { 
                Map.Entry<K,V> e = i.next(); 
                K key = e.getKey(); 
                V value = e.getValue(); 
                if (value == null) { 
                    if (!(t.get(key)==null && t.containsKey(key))) 
                        return false; 
                } else { 
                    if (!value.equals(t.get(key))) 
                        return false; 
                } 
            } 
        } catch (ClassCastException unused)   { 
            return false; 
        } catch (NullPointerException unused) { 
            return false; 
        } 

        return true; 
    } 

    // 计算Entry的hashCode 
    // 若 Hashtable的实际大小为0 或者 加载因子<0,则返回0。 
    // 否则,返回“Hashtable中的每个Entry的key和value的异或值 的总和”。 
    public synchronized int hashCode() { 
        int h = 0; 
        if (count == 0 || loadFactor < 0) 
            return h;  // Returns zero 

        loadFactor = -loadFactor;  // Mark hashCode computation in progress 
        Entry[] tab = table; 
        for (int i = 0; i < tab.length; i++) 
            for (Entry e = tab[i]; e != null; e = e.next) 
                h += e.key.hashCode() ^ e.value.hashCode(); 
        loadFactor = -loadFactor;  // Mark hashCode computation complete 

        return h; 
    } 

    // java.io.Serializable的写入函数 
    // 将Hashtable的“总的容量,实际容量,所有的Entry”都写入到输出流中 
    private synchronized void writeObject(java.io.ObjectOutputStream s) 
        throws IOException 
    { 
        // Write out the length, threshold, loadfactor 
        s.defaultWriteObject(); 

        // Write out length, count of elements and then the key/value objects 
        s.writeInt(table.length); 
        s.writeInt(count); 
        for (int index = table.length-1; index >= 0; index--) { 
            Entry entry = table[index]; 

            while (entry != null) { 
            s.writeObject(entry.key); 
            s.writeObject(entry.value); 
            entry = entry.next; 
            } 
        } 
    } 

    // java.io.Serializable的读取函数:根据写入方式读出 
    // 将Hashtable的“总的容量,实际容量,所有的Entry”依次读出 
    private void readObject(java.io.ObjectInputStream s) 
         throws IOException, ClassNotFoundException 
    { 
        // Read in the length, threshold, and loadfactor 
        s.defaultReadObject(); 

        // Read the original length of the array and number of elements 
        int origlength = s.readInt(); 
        int elements = s.readInt(); 

        // Compute new size with a bit of room 5% to grow but 
        // no larger than the original size.  Make the length 
        // odd if it's large enough, this helps distribute the entries. 
        // Guard against the length ending up zero, that's not valid. 
        int length = (int)(elements * loadFactor) + (elements / 20) + 3; 
        if (length > elements && (length & 1) == 0) 
            length--; 
        if (origlength > 0 && length > origlength) 
            length = origlength; 

        Entry[] table = new Entry[length]; 
        count = 0; 

        // Read the number of elements and then all the key/value objects 
        for (; elements > 0; elements--) { 
            K key = (K)s.readObject(); 
            V value = (V)s.readObject(); 
                // synch could be eliminated for performance 
                reconstitutionPut(table, key, value); 
        } 
        this.table = table; 
    } 

    private void reconstitutionPut(Entry[] tab, K key, V value) 
        throws StreamCorruptedException 
    { 
        if (value == null) { 
            throw new java.io.StreamCorruptedException(); 
        } 
        // Makes sure the key is not already in the hashtable. 
        // This should not happen in deserialized version. 
        int hash = key.hashCode(); 
        int index = (hash & 0x7FFFFFFF) % tab.length; 
        for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) { 
            if ((e.hash == hash) && e.key.equals(key)) { 
                throw new java.io.StreamCorruptedException(); 
            } 
        } 
        // Creates the new entry. 
        Entry<K,V> e = tab[index]; 
        tab[index] = new Entry<K,V>(hash, key, value, e); 
        count++; 
    } 

    // Hashtable的Entry节点,它本质上是一个单向链表。 
    // 也因此,我们才能推断出Hashtable是由拉链法实现的散列表 
    private static class Entry<K,V> implements Map.Entry<K,V> { 
        // 哈希值 
        int hash; 
        K key; 
        V value; 
        // 指向的下一个Entry,即链表的下一个节点 
        Entry<K,V> next; 

        // 构造函数 
        protected Entry(int hash, K key, V value, Entry<K,V> next) { 
            this.hash = hash; 
            this.key = key; 
            this.value = value; 
            this.next = next; 
        } 

        protected Object clone() { 
            return new Entry<K,V>(hash, key, value, 
                  (next==null ? null : (Entry<K,V>) next.clone())); 
        } 

        public K getKey() { 
            return key; 
        } 

        public V getValue() { 
            return value; 
        } 

        // 设置value。若value是null,则抛出异常。 
        public V setValue(V value) { 
            if (value == null) 
                throw new NullPointerException(); 

            V oldValue = this.value; 
            this.value = value; 
            return oldValue; 
        } 

        // 覆盖equals()方法,判断两个Entry是否相等。 
        // 若两个Entry的key和value都相等,则认为它们相等。 
        public boolean equals(Object o) { 
            if (!(o instanceof Map.Entry)) 
                return false; 
            Map.Entry e = (Map.Entry)o; 

            return (key==null ? e.getKey()==null : key.equals(e.getKey())) && 
               (value==null ? e.getValue()==null : value.equals(e.getValue())); 
        } 

        public int hashCode() { 
            return hash ^ (value==null ? 0 : value.hashCode()); 
        } 

        public String toString() { 
            return key.toString()+"="+value.toString(); 
        } 
    } 

    private static final int KEYS = 0; 
    private static final int VALUES = 1; 
    private static final int ENTRIES = 2; 

    // Enumerator的作用是提供了“通过elements()遍历Hashtable的接口” 和 “通过entrySet()遍历Hashtable的接口”。 
    private class Enumerator<T> implements Enumeration<T>, Iterator<T> { 
        // 指向Hashtable的table 
        Entry[] table = Hashtable.this.table; 
        // Hashtable的总的大小 
        int index = table.length; 
        Entry<K,V> entry = null; 
        Entry<K,V> lastReturned = null; 
        int type; 

        // Enumerator是 “迭代器(Iterator)” 还是 “枚举类(Enumeration)”的标志 
        // iterator为true,表示它是迭代器;否则,是枚举类。 
        boolean iterator; 

        // 在将Enumerator当作迭代器使用时会用到,用来实现fail-fast机制。 
        protected int expectedModCount = modCount; 

        Enumerator(int type, boolean iterator) { 
            this.type = type; 
            this.iterator = iterator; 
        } 

        // 从遍历table的数组的末尾向前查找,直到找到不为null的Entry。 
        public boolean hasMoreElements() { 
            Entry<K,V> e = entry; 
            int i = index; 
            Entry[] t = table; 
            /* Use locals for faster loop iteration */
            while (e == null && i > 0) { 
                e = t[--i]; 
            } 
            entry = e; 
            index = i; 
            return e != null; 
        } 

        // 获取下一个元素 
        // 注意:从hasMoreElements() 和nextElement() 可以看出“Hashtable的elements()遍历方式” 
        // 首先,从后向前的遍历table数组。table数组的每个节点都是一个单向链表(Entry)。 
        // 然后,依次向后遍历单向链表Entry。 
        public T nextElement() { 
            Entry<K,V> et = entry; 
            int i = index; 
            Entry[] t = table; 
            /* Use locals for faster loop iteration */
            while (et == null && i > 0) { 
                et = t[--i]; 
            } 
            entry = et; 
            index = i; 
            if (et != null) { 
                Entry<K,V> e = lastReturned = entry; 
                entry = e.next; 
                return type == KEYS ? (T)e.key : (type == VALUES ? (T)e.value : (T)e); 
            } 
            throw new NoSuchElementException("Hashtable Enumerator"); 
        } 

        // 迭代器Iterator的判断是否存在下一个元素 
        // 实际上,它是调用的hasMoreElements() 
        public boolean hasNext() { 
            return hasMoreElements(); 
        } 

        // 迭代器获取下一个元素 
        // 实际上,它是调用的nextElement() 
        public T next() { 
            if (modCount != expectedModCount) 
                throw new ConcurrentModificationException(); 
            return nextElement(); 
        } 

        // 迭代器的remove()接口。 
        // 首先,它在table数组中找出要删除元素所在的Entry, 
        // 然后,删除单向链表Entry中的元素。 
        public void remove() { 
            if (!iterator) 
                throw new UnsupportedOperationException(); 
            if (lastReturned == null) 
                throw new IllegalStateException("Hashtable Enumerator"); 
            if (modCount != expectedModCount) 
                throw new ConcurrentModificationException(); 

            synchronized(Hashtable.this) { 
                Entry[] tab = Hashtable.this.table; 
                int index = (lastReturned.hash & 0x7FFFFFFF) % tab.length; 

                for (Entry<K,V> e = tab[index], prev = null; e != null; 
                     prev = e, e = e.next) { 
                    if (e == lastReturned) { 
                        modCount++; 
                        expectedModCount++; 
                        if (prev == null) 
                            tab[index] = e.next; 
                        else
                            prev.next = e.next; 
                        count--; 
                        lastReturned = null; 
                        return; 
                    } 
                } 
                throw new ConcurrentModificationException(); 
            } 
        } 
    } 


    private static Enumeration emptyEnumerator = new EmptyEnumerator(); 
    private static Iterator emptyIterator = new EmptyIterator(); 

    // 空枚举类 
    // 当Hashtable的实际大小为0;此时,又要通过Enumeration遍历Hashtable时,返回的是“空枚举类”的对象。 
    private static class EmptyEnumerator implements Enumeration<Object> { 

        EmptyEnumerator() { 
        } 

        // 空枚举类的hasMoreElements() 始终返回false 
        public boolean hasMoreElements() { 
            return false; 
        } 

        // 空枚举类的nextElement() 抛出异常 
        public Object nextElement() { 
            throw new NoSuchElementException("Hashtable Enumerator"); 
        } 
    } 


    // 空迭代器 
    // 当Hashtable的实际大小为0;此时,又要通过迭代器遍历Hashtable时,返回的是“空迭代器”的对象。 
    private static class EmptyIterator implements Iterator<Object> { 

        EmptyIterator() { 
        } 

        public boolean hasNext() { 
            return false; 
        } 

        public Object next() { 
            throw new NoSuchElementException("Hashtable Iterator"); 
        } 

        public void remove() { 
            throw new IllegalStateException("Hashtable Iterator"); 
        } 

    } 
}


 
四、Hashtable和HashMap的相同点:

HashMap和Hashtable都是存储“键值对(key-value)”的散列表,而且都是采用拉链法实现的。

存储的思想都是:通过table数组存储,数组的每一个元素都是一个Entry;而一个Entry就是一个单向链表,Entry链表中的每一个节点就保存了key-value键值对数据。

添加key-value键值对:首先,根据key值计算出哈希值,再计算出数组索引(即,该key-value在table中的索引)。然后,根据数组索引找到Entry(即,单向链表),再遍历单向链表,将key和链表中的每一个节点的key进行对比。若key已经存在Entry链表中,则用该value值取代旧的value值;若key不存在Entry链表中,则新建一个key-value节点,并将该节点插入Entry链表的表头位置。

删除key-value键值对:删除键值对,相比于“添加键值对”来说,简单很多。首先,还是根据key计算出哈希值,再计算出数组索引(即,该key-value在table中的索引)。然后,根据索引找出Entry(即,单向链表)。若节点key-value存在与链表Entry中,则删除链表中的节点即可。


 
五、Hashtable与HashMap的区别:

1、继承的父类不同:

Hashtable继承的是Dictionary类,HashMap继承的是AbstractMap,但两者都实现了Map接口。

HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。
Hashtable 继承于Dictionary,实现了Map、Cloneable、java.io.Serializable接口。

HashMap的定义:

public class HashMap<K,V>
    extends AbstractMap<K,V>
    implements Map<K,V>, Cloneable, Serializable { ... }

Hashtable的定义:

public class Hashtable<K,V>
    extends Dictionary<K,V>
    implements Map<K,V>, Cloneable, java.io.Serializable { ... }

(1) HashMap和Hashtable都实现了Map、Cloneable、java.io.Serializable接口。
      实现了Map接口,意味着它们都支持key-value键值对操作。支持“添加key-value键值对”、“获取key”、“获取value”、“获取map大小”、“清空map”等基本的key-value键值对操作。
      实现了Cloneable接口,意味着它能被克隆。
      实现了java.io.Serializable接口,意味着它们支持序列化,能通过序列化去传输。

(2). HashMap继承于AbstractMap,而Hashtable继承于Dictionary
      Dictionary是一个抽象类,它直接继承于Object类,没有实现任何接口。虽然Dictionary也支持“添加key-value键值对”、“获取value”、“获取大小”等基本操作,但它的API函数比Map少;而且Dictionary一般是通过Enumeration(枚举类)去遍历,Map则是通过Iterator(迭代器)去遍历。 然而‘由于Hashtable也实现了Map接口,所以,它即支持Enumeration遍历,也支持Iterator遍历。
      AbstractMap是一个抽象类,它实现了Map接口的绝大部分API函数;为Map的具体实现类提供了极大的便利。


2、是否允许null:

HashMap可以允许存在一个 null 的 key 和任意个 null 的 value,不过建议尽量避免这样使用null作为 key,HashMap以null作为key时,总是存储在table数组的第一个节点table[0]为头结点的链表中;Hashtable中的 key 和 value 都不允许为 null 。

在HashMap中,当get()方法返回null值时,可能是 HashMap中没有该键,也可能使该键所对应的值为null。因此,在HashMap中不能由get()方法来判断HashMap中是否存在某个键, 而应该用containsKey()方法来判断。

(1)当HashMap遇到为null的key时,它会调用putForNullKey方法来进行处理。对于value没有进行任何处理,只要是对象都可以。

if (key == null)
            return putForNullKey(value);

(2)如果在Hashtable中有类似put(null,null)的操作,编译时可以通过,因为key和value都是Object类型,但运行时会抛出NullPointerException异常。

if (value == null) {
            throw new NullPointerException();
        }

3、Hashtable的方法是线程安全的,底层的每个方法都使用synchronized的,而HashMap的方法多线程不安全。

虽然HashMap不是线程安全的,但是它的效率会比Hashtable要好很多。当需要多线程操作的时候可以使用线程安全的ConcurrentHashMap。ConcurrentHashMap虽然也是线程安全的,但是它的效率比Hashtable要高好多倍。因为ConcurrentHashMap使用了分段锁,并不对整个数据进行锁定。

4、遍历不同:HashMap仅支持Iterator的遍历方式,Hashtable支持Iterator和Enumeration两种遍历方式。

Iterator和Enumeration函数接口不同:

        Enumeration只有2个函数接口。通过Enumeration,我们只能读取集合的数据,而不能对数据进行修改。
        Iterator只有3个函数接口。Iterator除了能读取集合的数据之外,也能数据进行删除操作。

package java.util;

public interface Enumeration<E> {

    boolean hasMoreElements();

    E nextElement();
}

package java.util;

public interface Iterator<E> {
    boolean hasNext();

    E next();

    void remove();
}


Iterator支持fail-fast机制,而Enumeration不支持:

        Enumeration 是JDK 1.0添加的接口。使用到它的函数包括Vector、Hashtable等类,这些类都是JDK 1.0中加入的,Enumeration存在的目的就是为它们提供遍历接口。Enumeration本身并没有支持同步,而在Vector、Hashtable实现Enumeration时,添加了同步。
        而Iterator 是JDK 1.2才添加的接口,它也是为了HashMap、ArrayList等集合提供遍历接口。Iterator是支持fail-fast机制的:当多个线程对同一个集合的内容进行操作时,就可能会产生fail-fast事件。


(1)HashMap 的Iterator 使用的是fail-fast 迭代器,当有其他线程改变了 HashMap 的结构(增加、删除、修改元素),将会抛出ConcurrentModificationException。

(2)JDK8之前的版本中,Hashtable是没有fast-fail机制的。在JDK8及以后的版本中 ,HashTable也是使用fast-fail的, 源码如下: 

if (expectedModCount != modCount) {
     throw new ConcurrentModificationException();
  }

modCount 的使用类似于并发编程中的 CAS( Compare and Swap) 技术,每次在发生增删改操作的时候,都会出现modCount++的动作,而modcount可以理解为是当前hashtable的状态。每发生一次操作,状态+1。设置这个状态,主要是用于hashtable 等容器类在迭代时,判断数据是否过时时使用的。尽管hashtable采用了原生的同步锁来保护数据安全。但是在出现迭代数据的时候,则无法保证边迭代,边正确操作。于是使用这个值来标记状态。一旦在迭代的过程中状态发生了改变,则会快速抛出一个异常,终止迭代行为。

5、是否提供contains方法:

(1)HashMap把Hashtable的contains()方法去掉了,改成containsValue 和 containsKey ,因为contains() 方法容易让人引起误解;

(2)Hashtable则保留了contains,containsValue 和 containsKey 三个方法 ,其中 contains 和 containsValue 功能相同。

6、内部实现使用的数值初始化 和 扩容方式不同:

HashMap默认的容量大小是16;增加容量时,每次将容量变为“原始容量x2”。
Hashtable默认的容量大小是11;增加容量时,每次将容量变为“原始容量x2 + 1”。


HashMap默认的“加载因子”是0.75, 默认的容量大小是16。

当HashMap的 “实际容量” >= “阈值”时,(阈值 = 总的容量 * 加载因子),就将HashMap的容量翻倍。

Hashtable默认的“加载因子”是0.75, 默认的容量大小是11。

当Hashtable的 “实际容量” >= “阈值”时,(阈值 = 总的容量 x 加载因子),就将变为“原始容量x2 + 1”。

(1)两者的默认负载因子都是0.75,但Hashtable扩容时,容量变为原来的2倍+1,HashMap扩容时,将容量变成原来的2倍;Hashtable在不制定容量的情况下默认容量是11,也就是说Hashtable会尽量使用素数、奇数,而HashMap 的默认容量 为16,Hashtable不要求底层数组的容量为2的整数次幂,而 HashMap 要求一定为2的整数次幂。

(2)之所以会有这样的不同,是因为Hashtable和HashMap设计时的侧重点不同。Hashtable的侧重点是哈希的结果更加均匀,使得哈希冲突减少。当哈希表的大小为素数时,简单的取模哈希的结果会更加均匀。而HashMap则更加关注hash的计算效率问题。在取模计算时,如果模数是2的幂,那么我们可以直接使用位运算来得到结果,效率要大大高于做除法。HashMap为了加快hash的速度,将哈希表的大小固定为了2的幂。当然这引入了哈希分布不均匀的问题,所以HashMap为解决这问题,又对hash算法做了一些改动。这从而导致了Hashtable和HashMap的计算hash值的方法不同。

7、hash 值不同:

(1)Hashtable直接使用Object的hashCode(),hashCode是JDK根据对象的地址或者字符串或者数字算出来的int类型的数值,然后再使用去取模运算来获得最终的位置。 这里一般先用 hash & 0x7FFFFFFF 后,再对length取模,&0x7FFFFFFF的目的是为了将负的hash值转化为正值,因为hash值有可能为负数,而 hash & 0x7FFFFFFF 后,只有符号外改变,而后面的位都不变。Hashtable在计算元素的位置时需要进行一次除法运算,而除法运算是比较耗时的。 

int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;

(2)为了提高计算效率,HashMap 将哈希表的大小固定为了2的幂,这样在取模预算时,不需要做除法,只需要做位运算。位运算比除法的效率要高很多。HashMap的效率虽然提高了,但是hash冲突却也增加了。因为它得出的hash值的低位相同的概率比较高,HashMap的效率虽然提高了,但是hash冲突却也增加了。因为它得出的hash值的低位相同的概率比较高。而计算位运算为了解决这个问题,HashMap重新根据hashcode计算hash值后,又对hash值做了一些运算来打散数据。使得取得的位置更加分散,从而减少了hash冲突。当然了,为了高效,HashMap只做了一些简单的位处理。从而不至于把使用2 的幂次方带来的效率提升给抵消掉。

  static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }
 

















分享到:
评论
发表评论

文章已被作者锁定,不允许评论。

相关推荐

    深入剖析iOS性能优化.pdf

    此外,使用hashtable(散列表)在实现高效键值对存储时,具有非常优秀的平均时间复杂度O(1)。 内存管理 内存管理是性能优化中一个不可或缺的部分。iOS应用在内存使用上有限制,过度使用或不当使用都可能导致应用...

    STL 源码剖析.pdf

    书中对STL组件的实现进行了深入的讨论,包括了vector、List、heap、deque等容器的实现,以及Red-Black Tree、hashtable、set和map等数据结构的实现。此外,读者还将学习到排序、查找、排列组合以及数据移动与复制等...

    stl 源码剖析 简体 中文版

    《STL源码剖析》这本图书,是由华中科技大学出版社出版,作者侯捷详细解析了STL的源码,旨在帮助读者深入理解STL的实现原理和机制。 首先,STL的适用范围和读者定位非常明确。它并不适合C++初学者、泛型编程技术...

    ConcurrentHashMap源码剖析

    通过对ConcurrentHashMap的深入剖析,我们可以看到它通过锁分段技术极大地提高了多线程环境下的并发性能。此外,其内部设计还体现了对易变性和不变性的巧妙运用,以及高效的定位和扩容机制,这些都是值得学习的关键...

    j2eeConnection

    通过这些关键点的深入剖析,旨在为读者提供一个清晰的理解框架,帮助大家更好地掌握这些基础组件的工作原理及应用场景。 #### Connection在J2EE中的应用 在J2EE(Java 2 Platform, Enterprise Edition)框架中,`...

    stl源码剖析源代码-免费

    本压缩包包含STL源码,对于学习C++和深入理解STL的工作原理非常有价值。 在STL中,`algorithm`是一个关键的头文件,它包含了大量的通用算法,如排序、查找、交换、复制等。这些算法可以用于各种数据结构,如数组、...

    PHP内核介绍及扩展开发指南.pdf

    接下来,书中详细剖析了HashTable结构,这是PHP实现数组和符号表的基础。HashTable是一种高效的数据结构,用于存储键值对。它采用了开放寻址法或链地址法来解决冲突,使得查找、插入和删除操作具有较高的效率。PHP...

    Memcached源码剖析笔记.pdf

    《Memcached源码剖析笔记》是一份深入解析Memcached内部工作原理和技术细节的文档,旨在帮助读者理解这个高性能分布式内存对象缓存系统的设计与实现。Memcached被广泛应用于动态Web应用程序,通过缓存数据和对象,...

    侯捷注解的SGI STL Doc文档

    2. **rw-algorithm-cc.doc**:可能包含对C++标准算法库的进一步讨论和实现细节,如通用算法的实现原理。 3. **sgi-stl-rope.doc**:Rope是一种特殊的数据结构,用于高效处理大量文本,尤其是在插入和删除操作上表现...

    Brian Goetz - 构造一个更好的hashmap

    总体而言,Brian Goetz在文章中不仅深入剖析了ConcurrentHashMap的工作原理,还讲解了如何在保证线程安全的前提下优化数据结构以提高并发性能,这对于Java并发编程的学习者而言是非常有帮助的。通过阅读这篇文章,...

    最新Java面试题视频网盘,Java面试题84集、java面试专属及面试必问课程

    │ Java面试题11.HashMap和HashTable的区别.mp4 │ Java面试题12.实现一个拷贝文件的类使用字节流还是字符串.mp4 │ Java面试题13.线程的实现方式 怎么启动线程怎么区分线程.mp4 │ Java面试题14.线程并发库和线程池...

    二十三种设计模式【PDF版】

    整个设计模式贯穿一个原理:面对接口编程,而不是面对实现.目标原则是:降低耦合,增强灵活性. 建筑和软件中模式之异同 CSDN 的透明特别推崇《建筑的永恒之道》,认为从中探寻到软件的永恒之道,并就"设计模式"写了专门...

Global site tag (gtag.js) - Google Analytics