`

[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论

阅读更多

Java类库中出现的第一个关联的集合类是Hashtable,它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能,这当然也是方便的。然而,线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时,无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的,它通过提供一个不同步的基类和一个同步的包装器Collections.synchronizedMap,解决了线程安全性问题。

通过将基本的功能从线程安全性中分离开来,Collections.synchronizedMap允许需要同步的用户可以拥有同步,而不需要同步的用户则不必为同步付出代价。HashtablesynchronizedMap所采取的获得同步的简单方法(同步Hashtable中或者同步的Map包装器对象中的每个方法)有两个主要的不足。首先,这种方法对于可伸缩性是一种障碍,因为一次只能有一个线程可以访问hash表。同时,这样仍不足以提供真正的线程安全性,许多公用的混合操作仍然需要额外的同步。

虽然诸如get()put()之类的简单操作可以在不需要额外同步的情况下安全地完成,但还是有一些公用的操作序列,例如迭代或者put-if-absent(空则放入),需要外部的同步,以避免数据争用。有条件的线程安全性同步的集合包装器 synchronizedMapsynchronizedList,有时也被称作有条件地线程安全――所有单个的操作都是线程安全的,但是多个操作组成的操作序列却可能导致数据争用,因为在操作序列中控制流取决于前面操作的结果。

如果一个条目不在Map中,那么添加这个条目。不幸的是,在 containsKey()方法返回到put()方法被调用这段时间内,可能会有另一个线程也插入一个带有相同键的值。如果您想确保只有一次插入,您需要用一个对Map进行同步的同步块将这一对语句包装起来。List.size()的结果在循环的执行期间可能会变得无效,因为另一个线程可以从这个列表中删除条目。可能在进入循环的最后一次迭代之后有一个条目被另一个线程删除了,则List.get()将返回null,抛出一个 NullPointerException异常。那么,采取什么措施才能避免这种情况呢?如果当您正在迭代一个List时另一个线程也可能正在访问这个 List,那么在进行迭代时您必须使用一个synchronized块将这个List包装起来,在List上同步,从而锁住整个List

这样做虽然解决了数据争用问题,但是在并发性方面付出了更多的代价,因为在迭代期间锁住整个List会阻塞其他线程,使它们在很长一段时间内不能访问这个列表。集合框架引入了迭代器,用于遍历一个列表或者其他集合,从而优化了对一个集合中的元素进行迭代的过程。然而,在java.util集合类中实现的迭代器极易崩溃,也就是说,如果在一个线程正在通过一个Iterator遍历集合时,另一个线程也来修改这个集合,那么接下来的 Iterator.hasNext()Iterator.next()调用,会抛出ConcurrentModificationException异常。

如果想要防止出现ConcurrentModificationException异常,那么当您正在进行迭代时,您必须使用一个在 Listl上同步的synchronized块将该List包装起来,从而锁住整个List。(也可以调用List.toArray(),在不同步的情况下对数组进行迭代,但是如果列表比较大的话这样做代价很高)。

ConcurrentHashMapDougLeautil.concurrent包的一部分,现已被集成到 JDK5.0,它提供比Hashtable或者synchronizedMap更高程度的并发性。而且,对于大多数成功的get()操作它会设法避免完全锁定,其结果就是使得并发应用程序有着非常好的吞吐量。

1.       针对吞吐量进行优化

ConcurrentHashMap使用了几个技巧来获得高程度的并发以及避免锁定,包括为不同的hashbucket(桶)使用多个写锁和使用JMM的不确定性来最小化锁被保持的时间——或者根本避免获取锁。对于大多数一般用法来说它是经过优化的,这些用法往往会检索一个很可能在map中已经存在的值。事实上,多数成功的get()操作根本不需要任何锁定就能运行。(警告:不要自己试图这样做!想比JMM聪明不像看上去的那么容易。util.concurrent类是由并发专家编写的,并且在JMM安全性方面经过了严格的同行评审。)

2.       多个写锁

我们可以回想一下,Hashtable(或者替代方案 Collections.synchronizedMap)的可伸缩性的主要障碍是它使用了一个map范围(map-wide)的锁,为了保证插入、删除或者检索操作的完整性必须保持这样一个锁,而且有时候甚至还要为了保证迭代遍历操作的完整性保持这样一个锁。这样一来,只要锁被保持,就从根本上阻止了其他线程访问Map,即使处理器有空闲也不能访问,这样大大地限制了并发性。

ConcurrentHashMap摒弃了单一的map范围的锁,取而代之的是由32个锁组成的集合,其中每个锁负责保护hashbucket的一个子集。锁主要由变化性操作(put()remove())使用。具有32 个独立的锁意味着最多可以有32个线程可以同时修改map。这并不一定是说在并发地对map进行写操作的线程数少于32时,另外的写操作不会被阻塞—— 32对于写线程来说是理论上的并发限制数目,但是实际上可能达不到这个值。但是,32依然比1要好得多,而且对于运行于目前这一代的计算机系统上的大多数应用程序来说已经足够了。

3.       map范围的操作

32个独立的锁,其中每个锁保护hashbucket的一个子集,这样需要独占访问 map的操作就必须获得所有32个锁。一些map范围的操作,比如说size()isEmpty(),也许能够不用一次锁整个map(通过适当地限定这些操作的语义),但是有些操作,比如map重排(扩大hashbucket的数量,随着map的增长重新分布元素),则必须保证独占访问。Java语言不提供用于获取可变大小的锁集合的简便方法。必须这么做的情况很少见,一旦碰到这种情况,可以用递归方法来实现。

4.       JMM概述

在进入 put()get()remove()的实现之前,让我们先简单地看一下JMMJMM掌管着一个线程对内存的动作(读和写)影响其他线程对内存的动作的方式。由于使用处理器寄存器和预处理cache来提高内存访问速度带来的性能提升,Java语言规范(JLS)允许一些内存操作并不对于所有其他线程立即可见。有两种语言机制可用于保证跨线程内存操作的一致性——synchronizedvolatile
按照JLS的说法,在没有显式同步的情况下,一个实现可以自由地更新主存,更新时所采取的顺序可能是出人意料的。其意思是说,如果没有同步的话,在一个给定线程中某种顺序的写操作对于另外一个不同的线程来说可能呈现出不同的顺序,并且对内存变量的更新从一个线程传播到另外一个线程的时间是不可预测的。

虽然使用同步最常见的原因是保证对代码关键部分的原子访问,但实际上同步提供三个独立的功能——原子性、可见性和顺序性。原子性非常简单——同步实施一个可重入的(reentrant)互斥,防止多于一个的线程同时执行由一个给定的监视器保护的代码块。不幸的是,多数文章都只关注原子性方面,而忽略了其他方面。但是同步在JMM中也扮演着很重要的角色,会引起JVM在获得和释放监视器的时候执行内存壁垒(memorybarrier)。

一个线程在获得一个监视器之后,它执行一个读屏障(readbarrier——使得缓存在线程局部内存(比如说处理器缓存或者处理器寄存器)中的所有变量都失效,这样就会导致处理器重新从主存中读取同步代码块使用的变量。与此类似,在释放监视器时,线程会执行一个写屏障(writebarrier——将所有修改过的变量写回主存。互斥独占和内存壁垒结合使用意味着只要您在程序设计的时候遵循正确的同步法则(也就是说,每当写一个后面可能被其他线程访问的变量,或者读取一个可能最后被另一个线程修改的变量时,都要使用同步),每个线程都会得到它所使用的共享变量的正确的值。

分享到:
评论

相关推荐

    HashMapvs.TreeMapvs.Hashtable

    `Hashtable`不允许null键和null值,并且它的实现方式相对过时,现在通常推荐使用`Collections.synchronizedMap()`将`HashMap`转换为线程安全的版本,或者使用`ConcurrentHashMap`,后者在多线程环境下的性能更好。...

    关于如何解决HashMap线程安全问题的介绍

    无论是使用Collections.synchronizedMap()、ConcurrentHashMap还是避免在多线程环境中使用,都需要根据应用的具体场景来权衡性能与安全。在设计和编写多线程程序时,要始终关注数据结构的选择和操作的同步控制,以...

    HashMap源码分析系列-第四弹:HashMap多线程解决方案.docx

    ### HashMap多线程解决方案 #### 一、引言 在多线程环境下,Java的`HashMap`类在处理并发操作时容易出现线程安全问题...而对于一些简单的应用场景,使用`Collections.synchronizedMap()`或`Hashtable`也能满足需求。

    java各个Map的区别.doc

    EnumMap 不是线程安全的,如果需要在多线程环境中使用,应通过 Collections.synchronizedMap 方法进行同步。 3. **HashMap**: 它是基于哈希表实现的 Map,提供了所有可选的映射操作,允许 null 键和值。HashMap 并...

    hashmap和hashtable的区别.docx

    - HashMap 未实现同步,这意味着在并发环境中使用需要手动使用 `Collections.synchronizedMap()` 来同步,或者使用 Java 5 引入的 ConcurrentHashMap,它提供了更好的并发性能和扩展性。 - Hashtable 的同步是内置...

    HashMap与HashTable的区别(含源码分析)

    如果在多线程环境中使用,需要程序员自己实现同步机制,如使用`synchronized`关键字或者`Collections.synchronizedMap()`。 2. null值处理: - `HashTable`不允许键或值为null,如果尝试插入null,会抛出`...

    HashMap和HashTable区别共2页.pdf.zi

    如果需要在多线程中使用,通常需要配合`Collections.synchronizedMap()`方法或者使用`ConcurrentHashMap`。 - `HashTable`则是线程安全的,它的每个方法都进行了同步,因此在多线程环境下可以保证数据一致性。但...

    Java-并发容器之ConcurrentHashMap

    传统的线程安全解决方案,如Hashtable或使用Collections.synchronizedMap包装HashMap,虽然实现了线程安全,但性能上并不理想,因为它们采用了独占锁,只允许单个线程执行操作。 在JDK 1.6版本中,...

    HashMap与HashTable区别

    例如,可以通过将`HashMap`对象包装在一个`Collections.synchronizedMap()`返回的对象中来实现这一点。 #### 二、允许null值和null键 - **HashTable**: 不允许使用`null`作为键或值。如果尝试插入一个键或值为`...

    求职宝典-Java 基础面试题

    可以通过Collections.synchronizedMap或ConcurrentHashMap来确保线程安全。HashTable自身是线程安全的,但其同步机制可能导致较低的并发性能。 4. **性能差异**:由于HashMap没有内置同步,它的put和get操作通常比...

    Java中Hashtable类与HashMap类的区别详解

    Java中的`Hashtable`和`...对于线程安全,可以使用`Collections.synchronizedMap()`或`ConcurrentHashMap`来替代`Hashtable`。同时,注意自定义键类需正确实现`hashCode()`和`equals()`方法,以保证哈希表的正确操作。

    HashMap底层原理.pdf

    而如果需要线程安全的HashMap,则可以通过Collections的synchronizedMap方法或者使用ConcurrentHashMap来实现。 HashMap的存储结构基于数组+链表+红黑树的方式实现。在JDK 1.8之前,HashMap仅使用数组和链表结构,...

    java中HashMap,LinkedHashMap,TreeMap,HashTable的区别

    - **非线程安全**:由于它不是同步的,因此不能直接在多线程环境中使用,除非将其包装到`Collections.synchronizedMap()`中或使用`ConcurrentHashMap`。 - **存储null键和值**:`HashMap`允许一个`null`键和多个`...

    java.util.concurrent系列文章(2)

    - **背景**:传统的 `Hashtable` 和 `Collections.synchronizedMap` 使用单个全局锁来确保数据的一致性,这意味着在同一时间只有一个线程能够执行读写操作,从而极大地限制了并发能力。 - **解决方法**:`...

    最新Java程序员面试题

    相比而言,使用Collections.synchronizedMap()或ConcurrentHashMap可以提供更灵活的同步策略。 Comparable接口用于对象的自然排序,对象自身提供比较规则;Comparator接口则用于外部定义排序规则,可以实现多种排序...

    javamianshiti.rar_java面试笔试题_笔试题

    - ConcurrentHashMap与Collections.synchronizedMap:讨论并发环境下集合的使用。 5. **多线程**: - 线程的创建:通过实现Runnable接口或继承Thread类创建线程。 - 线程同步:掌握synchronized关键字、wait/...

    java面试题及解答

    - **性能**:在高并发场景下,`ConcurrentHashMap`通常比使用`Collections.synchronizedMap()`包装后的`HashMap`性能更高。 #### 6. HashMap和HashTable的区别 - **线程安全性**:`HashTable`是线程安全的,而`...

    HashMap 和 Hashtable的区别

    如果需要在多线程中使用,必须通过外部同步机制(如 `synchronized` 关键字或 `Collections.synchronizedMap()` 方法)来确保线程安全。 - `Hashtable` 是线程安全的,内部实现了同步机制,因此在多线程环境中可以...

    java面试题——详解HashMap和Hashtable 的区别

    - 由于 `Hashtable` 的线程安全特性可以通过其他方式实现,比如使用 `Collections.synchronizedMap()` 工具方法,因此 `Hashtable` 在现代 Java 开发中逐渐被弃用,推荐使用 `ConcurrentHashMap` 来代替,它提供了...

    阿里P7面试题包含解答

    - `TreeMap`同样不是线程安全的,但可以通过`Collections.synchronizedMap()`方法使其变得线程安全,不过效率较低。 2. **空值处理**: - `HashTable`不接受null键或值。 - `HashMap`允许null键和值。 3. **...

Global site tag (gtag.js) - Google Analytics