`
youyu4
  • 浏览: 442090 次
社区版块
存档分类
最新评论

java -- HashMap

 
阅读更多

java -- HashMap

 

 

特点

 

  • HashMap 是一个散列表,它存储的内容是键值对(key-value)映射。
  • HashMap 继承于AbstractMap,实现了Map、Cloneable、java.io.Serializable接口。
  • HashMap 的实现不是同步的,这意味着它不是线程安全的。它的key、value都可以为null。此外,HashMap中的映射不是有序的。

 

 

 

扩容

 

  • 初始容量:哈希表在创建时的容量,默认是16
  • 加载因子:哈希表在其容量自动增加之前可以达到多满的一种尺,默认是0.75

当哈希表的容量超过 初始容量 * 加载因子,就会触发扩容,扩容后的哈希表大概是原来的两倍。

 

 

如何选择初始容量和加载因子

 

    通常,默认加载因子是 0.75, 这是在时间和空间成本上寻求一种折中。加载因子过高虽然减少了空间开销,但同时也增加了查询成本(在大多数 HashMap 类的操作中,包括 get 和 put 操作,都反映了这一点)。在设置初始容量时应该考虑到映射中所需的条目数及其加载因子,以便最大限度地减少 rehash 操作次数。如果初始容量大于最大条目数除以加载因子,则不会发生 rehash 操作。

 

 

 

 

HashMap的构造函数

 

// 默认构造函数。
HashMap()

// 指定“容量大小”的构造函数
HashMap(int capacity)

// 指定“容量大小”和“加载因子”的构造函数
HashMap(int capacity, float loadFactor)

// 包含“子Map”的构造函数
HashMap(Map<? extends K, ? extends V> map)

 

 

 

 

HashMap的API

 

void                 clear()
Object               clone()
boolean              containsKey(Object key)
boolean              containsValue(Object value)
Set<Entry<K, V>>     entrySet()
V                    get(Object key)
boolean              isEmpty()
Set<K>               keySet()
V                    put(K key, V value)
void                 putAll(Map<? extends K, ? extends V> map)
V                    remove(Object key)
int                  size()
Collection<V>        values()

 

 

 

 

数据结构

 

    说白了,HashMap就是数组和链表的结合,初始化时,会是一个数组,数组中每一个空间可以存一个Entry(HashMap的主干是一个Entry数组。Entry是HashMap的基本组成单元,每一个Entry包含一个key-value键值对)。在遇到Hash冲突时(当put一个key-value进去的时候,发现key已经被用了),就会用链表向下伸展,向下伸展的是一个单项连边,指向的下一个元素也是Entry。



 

 

 

 

哈希冲突

 

    当我们对某个元素进行哈希运算,得到一个存储地址,然后要进行插入的时候,发现已经被其他元素占用了,其实这就是所谓的哈希冲突,也叫哈希碰撞。

 

例如:

key = 1,value = 10,

key = 11,value = 20,

如果两个key进行hash后的是相同的,这样就会存在冲突,这样存储的值就有可能被覆盖。

 

 

解决方法

 

    数组 + 链表,Entry数组是根据key进行Hash后的值进行存放的,如果有hash冲突,就通过链表向下伸展,在查找元素时,是先在Entry数组中找,找到后,再向下遍历链表,找到key对应的Entry。

 

 

 

 

性能问题

 

      简单来说,HashMap由数组+链表组成的,数组是HashMap的主体,链表则是主要为了解决哈希冲突而存在的,如果定位到的数组位置不含链表(当前entry的next指向null),那么对于查找,添加等操作很快,仅需一次寻址即可;如果定位到的数组包含链表,对于添加操作,其时间复杂度依然为O(1),因为最新的Entry会插入链表头部,急需要简单改变引用链即可,而对于查找操作来讲,此时就需要遍历链表,然后通过key对象的equals方法逐一比对查找。所以,性能考虑,HashMap中的链表出现越少,性能才会越好。

 

    同时,在考虑性能时,也要考虑初始容量和加载因子,因为这会影响到扩容,也是影响性能的一部分。

 

 

 

 

HashMap下标计算

 

计算下标的流程大概如下:


 

1. 先调用hashCode(),拿到相应的hashCode

 

2. 通过hash(),获取一个h值

 

//这是一个神奇的函数,用了很多的异或,移位等运算,对key的hashcode进一步进行计算以及二进制位的调整等来保证最终获取的存储位置尽量分布均匀
final int hash(Object k) {
        int h = hashSeed;
        if (0 != h && k instanceof String) {
            return sun.misc.Hashing.stringHash32((String) k);
        }

        h ^= k.hashCode();

        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

 
 3. 然后通过对h执行indexFor(),得出最终下标

 

/**
     * 返回数组下标
     */
    static int indexFor(int h, int length) {
        return h & (length-1);
    }

 

 

 

 

为何HashMap的数组长度一定是2的次幂?

 

      如果不是2的次幂,也就是低位不是全为1此时,要使得index=21,h的低位部分不再具有唯一性了,哈希冲突的几率会变的更大,同时,index对应的这个bit位无论如何不会等于1了,而对应的那些数组位置也就被白白浪费了。

 

简单点说,减少出现Hash冲突。

 

 

 

 

重写equals方法需同时重写hashCode方法

 

      各种资料上都会提到,“重写equals时也要同时覆盖hashcode”,我们举个小例子来看看,如果重写了equals而不重写hashcode会发生什么样的问题。

 

/**
 * Created by chengxiao on 2016/11/15.
 */
public class MyTest {
    private static class Person{
        int idCard;
        String name;

        public Person(int idCard, String name) {
            this.idCard = idCard;
            this.name = name;
        }
        @Override
        public boolean equals(Object o) {
            if (this == o) {
                return true;
            }
            if (o == null || getClass() != o.getClass()){
                return false;
            }
            Person person = (Person) o;
            //两个对象是否等值,通过idCard来确定
            return this.idCard == person.idCard;
        }

    }
    public static void main(String []args){
        HashMap<Person,String> map = new HashMap<Person, String>();
        Person person = new Person(1234,"乔峰");
        //put到hashmap中去
        map.put(person,"天龙八部");
        //get取出,从逻辑上讲应该能输出“天龙八部”
        System.out.println("结果:"+map.get(new Person(1234,"萧峰")));
    }
}

 

输出结果:<结果:null>

 

      如果我们已经对HashMap的原理有了一定了解,这个结果就不难理解了。尽管我们在进行get和put操作的时候,使用的key从逻辑上讲是等值的(通过equals比较是相等的),但由于没有重写hashCode方法,所以put操作时,key(hashcode1)-->hash-->indexFor-->最终索引位置 ,而通过key取出value的时候 key(hashcode1)-->hash-->indexFor-->最终索引位置,由于hashcode1不等于hashcode2,导致没有定位到一个数组位置而返回逻辑上错误的值null(也有可能碰巧定位到一个数组位置,但是也会判断其entry的hash值是否相等,上面get方法中有提到。)

 

      所以,在重写equals的方法的时候,必须注意重写hashCode方法,同时还要保证通过equals判断相等的两个对象,调用hashCode方法要返回同样的整数值。而如果equals判断不相等的两个对象,其hashCode可以相同(只不过会发生哈希冲突,应尽量避免)。

 

 

 

 

HashMap遍历方法

 

方法一

// 假设map是HashMap对象
// map中的key是String类型,value是Integer类型
Integer integ = null;
Iterator iter = map.entrySet().iterator();
while(iter.hasNext()) {
    Map.Entry entry = (Map.Entry)iter.next();
    // 获取key
    key = (String)entry.getKey();
        // 获取value
    integ = (Integer)entry.getValue();
}

 

方法二

// 假设map是HashMap对象
// map中的key是String类型,value是Integer类型
String key = null;
Integer integ = null;
Iterator iter = map.keySet().iterator();
while (iter.hasNext()) {
        // 获取key
    key = (String)iter.next();
        // 根据key,获取value
    integ = (Integer)map.get(key);
}

 

方法三

// 假设map是HashMap对象
// map中的key是String类型,value是Integer类型
Integer value = null;
Collection c = map.values();
Iterator iter= c.iterator();
while (iter.hasNext()) {
    value = (Integer)iter.next();
}

 

 

 

 

相关面试题

 

1. HashMap的key能否为null?    能

 

 

2. HashMap的key重复的时候,会怎样? 

 

     从方法上,会将新值赋值给旧值,然后返回旧值;从数据结构上,会在hash后数组中找到对应的位置,然后新值保存在一个新对象中,然后指针next指向就的对象。

 

 

3. HashMap什么时候扩容

 

  • 初始容量 = 2的4次方 = 16
  • put方法调用的时候,判断容量是否使用到0.75,如果是就进行扩容,如果不是就不扩容
  • 容量会扩大为原来的2倍

 

4. HashMap的扩容是怎样的流程?

 

  • 先将容量扩大为原来的2倍
  • 然后遍历原来的key,通过Hash算法进行计算,看放在哪个位置
  • 如果遇到Hash碰撞,就用链表来存起后面数据

 

5. HashMap的数据结构

 

    数组  + 链表

 

 

6. HashMap的不足之处

 

  • 时间复杂度受Hash算法影响
  • 性能问题会在扩容上体现出来,如果上千或几万条数据,可以确定容量的话,在new HashMap的时候设置好容量,这样减少扩容带来的负担,可能减少Hash算法的调用。
  • 大小: 64.6 KB
  • 大小: 18.1 KB
分享到:
评论

相关推荐

    JAVA--HashMap热门面试题

    JAVA--HashMap热门面试题 HashMap 是 Java 中一个常用的集合框架,特别是在面试中,它是最常被问到的问题之一。在这里,我们将讨论一些热门的 HashMap 面试题,以帮助您更好地理解 HashMap 的工作原理和应用。 为...

    Java-HashMap.rar_hashmap_java hashmap

    在Java编程语言中,`HashMap`是`java.util`包中的一个核心类,它属于集合框架的一部分,主要用于存储键值对的数据结构。`HashMap`基于哈希表(散列表)实现,提供了快速的插入、删除和查找操作,平均时间复杂度为O(1...

    java提高篇(二三)-----HashMap.pdf

    HashMap是Java编程中非常重要的数据结构之一,它实现了Map接口,并继承了AbstractMap。HashMap以键值对(key-value)的形式存储数据,通过哈希算法高效地定位存储位置,允许快速存取。以下是对HashMap的深入解析: ...

    java课件-HashMap

    HashMap是Java编程语言中一种非常重要的数据结构,它属于Java集合框架的一部分,主要用来存储键值对(key-value pairs)。HashMap在内部实现上基于哈希表,提供了快速的插入、删除和查找操作,通常时间复杂度为O(1)...

    20-集合框架020-HashMap-1080P 高清-AVC20

    在这个主题中,我们将深入探讨HashMap类,它是Java集合框架中的一个关键组件,特别是在标题“20-集合框架020-HashMap-1080P 高清-AVC20”和描述中所提到的内容。 HashMap是Java.util包中的一个类,它实现了Map接口...

    Java-api文档

    4. **集合框架**:Java集合框架包括List、Set、Map等接口以及实现这些接口的类,如ArrayList、LinkedList、HashSet、HashMap等。它们提供了存储和操作对象的高效方式。 5. **输入/输出**:Java的I/O流系统支持文件...

    java程序-HashMap排序

    先根据value的值从小到大排序,value相同再根据key的字母顺序来排序

    Java-Interview-超全集合github上评分最高的jiva面试题

    - **Map**:HashMap、TreeMap、LinkedHashMap的工作机制,特别是HashMap的线程不安全问题及其解决方案。 - **集合接口与实现**:了解Collection、Iterable、List、Set、Map等接口,以及它们各自的实现类。 3. **...

    java-HashMap-loop

    这个"java-HashMap-loop"可能是指在遍历`HashMap`时遇到的一个问题,即由于某种原因导致的无限循环。 首先,我们需要了解`HashMap`的基本操作。`HashMap`中插入元素使用`put()`方法,查询元素使用`get()`方法,删除...

    计算机后端-Java-Java核心基础-第25章 集合02 12. HashMap在JDK8中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 12. HashMap在JDK8中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 11. HashMap在JDK7中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 11. HashMap在JDK7中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 09. HashMap在JDK7中的底层实现原理.avi

    计算机后端-Java-Java核心基础-第25章 集合02 09. HashMap在JDK7中的底层实现原理.avi

    计算机后端-Java-Java核心基础-第25章 集合02 10. HashMap在JDK8中的底层实现原理.avi

    计算机后端-Java-Java核心基础-第25章 集合02 10. HashMap在JDK8中的底层实现原理.avi

    Java 实例 - HashMap遍历源代码-详细教程.zip

    在Java编程语言中,HashMap是集合框架中一个重要的类,用于存储键值对的数据结构。这个实例教程将深入解析HashMap的遍历方法及其源代码,帮助开发者更好地理解和使用HashMap。以下是对这个主题的详细讲解: 1. **...

    java-hashmap:Java HashMap的插图

    Java HashMap的插图 Java HashMap HashMap类使用哈希表来实现Map接口。 这样,即使对于大型集合,诸如get()和put()之类的基本操作的执行时间也可以保持恒定。 目录 插图1:使用put()方法在HashMap中创建和...

    java7hashmap源码-JAVA-:JAVA-

    java7 hashmap源码 Notes 原理 basic 1 数据结构中各种东西的数量很很重要!!!可以考虑在在数据结构中定义一下 2 Java hashtable的contains用来查找是否存在value,和containsValue类似 查找key使用containskey...

Global site tag (gtag.js) - Google Analytics