`
zhangfa8710
  • 浏览: 2653 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java 集合总结-HashMap

 
阅读更多

HashMap 概述

HashMap 是基于哈希表的 Map 接口的非同步实现。此实现提供所有可选的映射操作,并允许使用 null 值和 null 键。此类不保证映射的顺序,特别是它不保证该顺序恒久不变。

迭代 collection 视图所需的时间与 HashMap 实例的“容量”(桶的数量)及其大小(键-值映射关系数)成比例。所以,如果迭代性能很重要,则不要将初始容量设置得太高或将加载因子设置得太低。

需要注意的是:Hashmap 不是同步的,如果多个线程同时访问一个 HashMap,而其中至少一个线程从结构上(指添加或者删除一个或多个映射关系的任何操作)修改了,则必须保持外部同步,以防止对映射进行意外的非同步访问

HashMap 的数据结构

在 Java 编程语言中,最基本的结构就是两种,一个是数组,另外一个是指针(引用),HashMap 就是通过这两个数据结构进行实现。HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体。

 

HashMap的迭代器(Iterator)是fail-fast迭代器,而Hashtable的enumerator迭代器不是fail-fast的。所以当有其它线程改变了HashMap的结构(增加或者移除元素),将会抛出ConcurrentModificationException,但迭代器本身的remove()方法移除元素则不会抛出ConcurrentModificationException异常。但这并不是一个一定发生的行为,要看JVM

 

  fail-fast迭代器备注:

迭代器的快速失败行为无法得到保证,因为一般来说,不可能对是否出现不同步并发修改做出任何硬性保证。快速失败迭代器会尽最大努力抛出 ConcurrentModificationException。因此,为提高这类迭代器的正确性而编写一个依赖于此异常的程序是错误的做法:迭代器的快速失败行为应该仅用于检测 bug。

EXP:

有两个线程(线程A,线程B),其中线程A负责遍历list、线程B修改list。线程A在遍历list过程的某个时候(此时expectedModCount = modCount=N),线程启动,同时线程B增加一个元素,这是modCount的值发生改变(modCount + 1 = N + 1)。线程A继续遍历执行next方法时,通告checkForComodification方法发现expectedModCount  = N  ,而modCount = N + 1,两者不等,这时就抛出ConcurrentModificationException 异常,从而产生fail-fast机制。

以ArrayList为例进一步分析fail-fast产生的原因:

我们知道fail-fast是在操作迭代器时产生的。现在我们来看看ArrayList中迭代器的源代码:

  1. private class Itr implements Iterator<E> {  
  2.         int cursor;  
  3.         int lastRet = -1;  
  4.         int expectedModCount = ArrayList.this.modCount;  
  5.   
  6.         public boolean hasNext() {  
  7.             return (this.cursor != ArrayList.this.size);  
  8.         }  
  9.   
  10.         public E next() {  
  11.             checkForComodification();  
  12.             /** 省略此处代码 */  
  13.         }  
  14.   
  15.         public void remove() {  
  16.             if (this.lastRet < 0)  
  17.                 throw new IllegalStateException();  
  18.             checkForComodification();  
  19.             /** 省略此处代码 */  
  20.         }  
  21.   
  22.         final void checkForComodification() {  
  23.             if (ArrayList.this.modCount == this.expectedModCount)  
  24.                 return;  
  25.             throw new ConcurrentModificationException();  
  26.         }  
  27.     } 

从上面的源代码我们可以看出,迭代器在调用next()、remove()方法时都是调用checkForComodification()方法,该方法主要就是检测modCount == expectedModCount ? 若不等则抛出ConcurrentModificationException 异常,从而产生fail-fast机制

expectedModCount 是在Itr中定义的:int expectedModCount = ArrayList.this.modCount;所以他的值是不可能会修改的,所以会变的就是modCount。modCount是在 AbstractList 中定义的,为全局变量:

 

[java] view plain copy
 
    1. protected transient int modCount = 0
    2. public boolean add(E paramE) {  
    3.     ensureCapacityInternal(this.size + 1);  
    4.     /** 省略此处代码 */  
    5. }  
    6.   
    7. private void ensureCapacityInternal(int paramInt) {  
    8.     if (this.elementData == EMPTY_ELEMENTDATA)  
    9.         paramInt = Math.max(10, paramInt);  
    10.     ensureExplicitCapacity(paramInt);  
    11. }  
    12.   
    13. private void ensureExplicitCapacity(int paramInt) {  
    14.     this.modCount += 1;    //修改modCount  
    15.     /** 省略此处代码 */  
    16. }  
    17.   
    18. ublic boolean remove(Object paramObject) {  
    19.     int i;  
    20.     if (paramObject == null)  
    21.         for (i = 0; i < this.size; ++i) {  
    22.             if (this.elementData[i] != null)  
    23.                 continue;  
    24.             fastRemove(i);  
    25.             return true;  
    26.         }  
    27.     else  
    28.         for (i = 0; i < this.size; ++i) {  
    29.             if (!(paramObject.equals(this.elementData[i])))  
    30.                 continue;  
    31.             fastRemove(i);  
    32.             return true;  
    33.         }  
    34.     return false;  
    35. }  
    36.   
    37. private void fastRemove(int paramInt) {  
    38.     this.modCount += 1;   //修改modCount  
    39.     /** 省略此处代码 */  
    40. }  
    41.   
    42. public void clear() {  
    43.     this.modCount += 1;    //修改modCount  
    44.     /** 省略此处代码 */  
    45. }  

        从上面的源代码我们可以看出,ArrayList中无论add、remove、clear方法只要是涉及了改变ArrayList元素的个数的方法都会导致modCount的改变。所以我们这里可以初步判断由于expectedModCount 得值与modCount的改变不同步,导致两者之间不等从而产生fail-fast机制

fail-fast解决办法

        方案一:在遍历过程中所有涉及到改变modCount值得地方全部加上synchronized或者直接使用Collections.synchronizedList,这样就可以解决。但是不推荐,因为增删造成的同步锁可能会阻塞遍历操作。

 

        方案二:使用CopyOnWriteArrayList来替换ArrayList。推荐使用该方案。

CopyOnWriteArrayList为何物?ArrayList 的一个线程安全的变体,其中所有可变操作(add、set 等等)都是通过对底层数组进行一次新的复制来实现的。 该类产生的开销比较大,但是在两种情况下,它非常适合使用。1:在不能或不想进行同步遍历,但又需要从并发线程中排除冲突时。2:当遍历操作的数量大大超过可变操作的数量时。遇到这两种情况使用CopyOnWriteArrayList来替代ArrayList再适合不过了。

  1. private static class COWIterator<E> implements ListIterator<E> {  

  2.         /** 省略此处代码 */  
  3.         public E next() {  
  4.             if (!(hasNext()))  
  5.                 throw new NoSuchElementException();  
  6.             return this.snapshot[(this.cursor++)];  
  7.         }  
  8.   
  9.         /** 省略此处代码 */  
  10.     }  
  11. public boolean add(E paramE) {  
  12.         ReentrantLock localReentrantLock = this.lock;  
  13.         localReentrantLock.lock();  
  14.         try {  
  15.             Object[] arrayOfObject1 = getArray();  
  16.             int i = arrayOfObject1.length;  
  17.             Object[] arrayOfObject2 = Arrays.copyOf(arrayOfObject1, i + 1);  
  18.             arrayOfObject2[i] = paramE;  
  19.             setArray(arrayOfObject2);  
  20.             int j = 1;  
  21.             return j;  
  22.         } finally {  
  23.             localReentrantLock.unlock();  
  24.         }  
  25.     }  
  26.   
  27.       
  28.     final void setArray(Object[] paramArrayOfObject) {  
  29.         this.array = paramArrayOfObject;  
  30.     }  
  31. CopyOnWriterArrayList的add方法与ArrayList的add方法有一个最大的不同点就在于,下面三句代码:

     

    [java] view plain copy
     
    1. Object[] arrayOfObject2 = Arrays.copyOf(arrayOfObject1, i + 1);  
    2. arrayOfObject2[i] = paramE;  
    3. setArray(arrayOfObject2);  

所以CopyOnWriterArrayList所代表的核心概念就是:任何对array在结构上有所改变的操作(add、remove、clear等),CopyOnWriterArrayList都会copy现有的数据,再在copy的数据上修改,这样就不会影响COWIterator中的数据了,修改完成之后改变原有数据的引用即可。同时这样造成的代价就是产生大量的对象,同时数组的copy也是相当有损耗的。

 

 

 

归纳

 

简单地说,HashMap 在底层将 key-value 当成一个整体进行处理,这个整体就是一个 Entry 对象。HashMap 底层采用一个 Entry[] 数组来保存所有的 key-value 对,当需要存储一个 Entry 对象时,会根据 hash 算法来决定其在数组中的存储位置,在根据 equals 方法决定其在该数组位置上的链表中的存储位置;当需要取出一个Entry 时,也会根据 hash 算法找到其在数组中的存储位置,再根据 equals 方法从该位置上的链表中取出该Entry

 

 

HashMap 的两种遍历方式

第一种

  Map map = new HashMap();
  Iterator iter = map.entrySet().iterator();
  while (iter.hasNext()) {
  Map.Entry entry = (Map.Entry) iter.next();
  Object key = entry.getKey();
  Object val = entry.getValue();
  }

效率高,以后一定要使用此种方式!

for(Map.Entry<String, Object> entry : paraMap.entrySet())    
{    
    System.out.println(entry.getKey()+": "+entry.getValue());    

其他几种:

循环Map的Key

for(String dataKey : paraMap.keySet())    
{    
    System.out.println(dataKey );               

 

第二种

  Map map = new HashMap();
  Iterator iter = map.keySet().iterator();
  while (iter.hasNext()) {
  Object key = iter.next();
  Object val = map.get(key);
  }

 

效率低,以后尽量少使用!

分享到:
评论

相关推荐

    java集合-HashMap的使用

    HashMap是一种常用的哈希表实现,用于存储键值对。它实现了Map接口,并且使用键的哈希值来快速定位和访问值。

    20-集合框架020-HashMap-1080P 高清-AVC20

    在这个主题中,我们将深入探讨HashMap类,它是Java集合框架中的一个关键组件,特别是在标题“20-集合框架020-HashMap-1080P 高清-AVC20”和描述中所提到的内容。 HashMap是Java.util包中的一个类,它实现了Map接口...

    java课件-HashMap

    HashMap是Java编程语言中一种非常重要的数据结构,它属于Java集合框架的一部分,主要用来存储键值对(key-value pairs)。HashMap在内部实现上基于哈希表,提供了快速的插入、删除和查找操作,通常时间复杂度为O(1)...

    Java-HashMap.rar_hashmap_java hashmap

    `www.pudn.com.txt`可能是提供资料来源的网站链接,这里主要关注的是`Java集合中HashMap的简单使用.txt`文件,它可能包含了关于如何在实际代码中运用`HashMap`的示例和解释。例如,如何创建`HashMap`,插入键值对,...

    Java基础-模拟HashMap集合(基于数组和链表) 数组和链表.pdf

    Java基础-模拟HashMap集合(基于数组和链表) 在本文中,我们将详细介绍如何模拟Java的HashMap集合,使用数组和链表来实现Hash表的存储。我们将从基本概念开始,逐步深入到HashMap的实现细节中。 什么是HashMap? ...

    java提高篇(二三)-----HashMap.pdf

    HashMap是Java编程中广泛使用的数据结构之一,它属于集合框架的一部分,主要用于存储键值对(key-value pairs)。HashMap是基于哈希表实现的,通过哈希函数计算键的存储位置,以此来快速存取对应的值。以下是HashMap...

    【死磕Java集合】-集合源码分析.pdf

    在Java集合框架中,LinkedList、ArrayList、HashMap、TreeMap等都是非常常用的数据结构。本文将对Java集合框架的源码进行分析,深入探讨其实现原理和机制。 一、LinkedList源码分析 LinkedList是一种以双向链表...

    Java 实例 - HashMap遍历源代码-详细教程.zip

    在Java编程语言中,HashMap是集合框架中一个重要的类,用于存储键值对的数据结构。这个实例教程将深入解析HashMap的遍历方法及其源代码,帮助开发者更好地理解和使用HashMap。以下是对这个主题的详细讲解: 1. **...

    Java集合专题总结:HashMap 和 HashTable 源码学习和面试总结

    Java集合专题总结:HashMap和HashTable源码学习和面试总结 本文总结了Java集合专题中的HashMap和HashTable,涵盖了它们的源码学习和面试总结。HashMap是一种基于哈希表的集合类,它的存储结构是一个数组,每个元素...

    精通java集合框架--List,Set..

    ### 精通Java集合框架——List, Set, Map #### 概述 Java集合框架是一种高度抽象且灵活的数据组织工具,它通过一系列接口来定义不同类型的数据容器,并提供了丰富的操作这些容器的方法。本文将深入探讨Java集合...

    Java-Java集合体系-List-Set

    Java集合体系是Java编程中非常核心的部分,涵盖了用于存储和操作数据的各种数据结构。在Java中,集合主要分为三大接口:List、Set和Map。这些接口各有特点,适用于不同的应用场景。 一、List接口 List接口是单列...

    Java知识总结--CoreJava.doc

    本文将深入探讨Java的核心特性,包括基本数据类型、异常处理、集合框架、多线程以及一些常见的编程概念。 1. **Java基本数据类型及所占位数** Java提供了八种基本数据类型,分为四类: - 整数类型:byte(1字节)...

    Java集合框架总结

    ### Java集合框架总结 #### 一、Java集合框架概述 Java集合框架是Java标准库的一部分,它提供了一系列的接口和类来存储和操作各种类型的对象集合。这些接口和类遵循一致的设计模式,使得开发人员可以方便地管理和...

    java-集合-知识点汇总

    Java集合有多种类型,常见的有ArrayList、LinkedList、HashSet、TreeSet、HashMap、TreeMap等。 * ArrayList:是一个基于数组的列表实现,支持随机访问和快速查找。 * LinkedList:是一个基于链表的列表实现,支持...

    深入解读大厂java面试必考基本功-HashMap集合配套文档代码资料

    在本套课程中,将会非常深入、非常详细、非常全面的解读HashMap以及...从底层的数据结构到底层源码分析以及怎样使用提高HashMap集合的效率问题等进行分析。如果掌握本套课程,那么再看其他javase的源码时会觉得很简单。

    JAVA--HashMap热门面试题

    HashMap 是 Java 中一个常用的集合框架,特别是在面试中,它是最常被问到的问题之一。在这里,我们将讨论一些热门的 HashMap 面试题,以帮助您更好地理解 HashMap 的工作原理和应用。 为什么我们建议在定义 HashMap...

    计算机后端-Java-Java核心基础-第25章 集合02 12. HashMap在JDK8中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 12. HashMap在JDK8中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 11. HashMap在JDK7中的源码分析.avi

    计算机后端-Java-Java核心基础-第25章 集合02 11. HashMap在JDK7中的源码分析.avi

Global site tag (gtag.js) - Google Analytics