zz Java并行(1):JMM
1.什么是JMM?
JMM即Java Memory Model,设想有这样一条赋值语句:int a = 1;而a为诸多线程所共享, JMM所关注的问题就是:“读取a的线程在何时会看到值为1的这个写入?”
2. 为什么关注JMM?
在多数情况下,即使是并发程序的程序员,也并不特别关心JMM,因为Java语言与JVM用更高抽象的“同步”语义隐藏了JMM的语义,使得程序员即便对JMM一无所知,也可以写出优雅的并发程序。许多介绍Java同步机制的资料也并不对JMM做过多的介绍。那么你可能会问,“那一上来就讨论JMM有毛用啊?”相信我,是有毛用的。虽然我对Java并不是十分精通,Java下的并发编程更是新上手的菜鸟,但近一段时间的学习经验告诉我,所谓同步,无非关注于两点,一是互斥性,二是可见性。结合自己过去的认识,对并发的理解过多侧重于“互斥性”,而对“可见性”一知半解,影响了对同步更精细的理解。JMM则对此有十分清晰的阐述。
3.JMM从何而来?
这就要从盘古开天辟地开始说起了……话说冯诺依曼童鞋当年提出经典的体系结构时,打死他想不到现代的计算机体系结构会发展到这个鸟样子。冯诺依曼模型是一个顺序化的计算模型,可见性不是什么问题,而今天的多处理器架构已经很少再使用顺序一致化模型,而且处理器和编译器的一些优化都会对内存的可见性产生影响:
a. 处理器乱序执行
b. 存储在处理器本地的缓存,对其他处理器不可见
c. 作为优化,编译器可能把变量存在寄存器而非内存
d. 聪明的编译器可能改变生成指令的顺序
更棘手的是,江湖之大,各门各派对这些行为并没有达成统一的共识,不同架构的处理器提供了不同级别的cache coherence,而所谓一种架构的Memroy Model,即是说在该架构中,Memory的行为对应用程序做出怎样的担保。而不同架构中memory barrier这样特殊的指令,正是为了获得memory协调性而引入的。而JMM则隐藏了这些不同架构MM的差异性,千秋万载一统江湖斯密达。
4. Happens-before关系
在介绍JMM之前,我们先来了解一些比较重要的概念:
a. 如果我们把程序看成一个“动作”的集合U,在一个程序的一次执行中,所有这些动作都会在时间上(注意是时间上)有一个次序关系,我们记做“tb”(time-before)关系,显然tb是一个“全序关系”(反对称,传递,并且任意两个动作可比)
b. 在这个“动作”集合中,有一些动作被称作“同步动作”,包括上锁/解锁,读写volitile变量,线程开始/结束等。在这个同步动作子集S上,有一个全序“sw”(synchronize-with)关系。详细的SW定义:
对同一个锁,有上锁动作A,解锁动作B,如果B tb A, 则B sw A
对同一个volatile变量,有写动作A,读动作B,如果B tb A,则B sw A
对于一个线程,start动作记做A,B为任一该线程中的动作,则A sw B
对于一个线程,检测到线程终结的动作记做A(包括join返回,isAlive返回false等),B为任一该线程中的动作,则B sw A
线程t1调用线程t2的interrupt动作记做A,t2检测到中断(抛出InterruptedException,或者检测到interrupt状态更改)记做B,则 A sw B
对一个变量默认值赋值(0,false,null)动作记做A,对它的任意操作记做B,则A sw B
一个对象的构造函数结束动作记做A,该对象的finalizer开始记做B,则A sw B
SW一致性含义:在全序SW中,任一个读操作读到的值是在它之前最后一个写操作写入的值。
c. 在动作集合U上,有一个偏序(自反,反对称,传递,但不是任意两个元素可比)“hb”(happens-before)关系,而他和sw关系有着千丝万缕的关系:那就是如果把sw关系从S集合拿到他的超集U中,求传递闭包,再加上“intra thread原则”——单一线程中,如果动作B在程序中出现在动作A之后,那么A hb B(这很好理解,相当于顺序模型运用在了每个线程内部)。
即有: HB = t(SW) + IntraThread.
OK,现在我们已经对HB关系做出了定义。之所以要把它用离散数学的语言写出来,不单单是为了装逼,而是我深感在一些概念性的解释中,数学语言的描述是最简洁、歧义最小、最易于理解的。
HB一致性的含义:对于一个变量,有读操作R,写操作W,如果不存在R hb W,并且也不存在另一个写操作W’,使得W hb W‘,并且W’ hb R,那么,W所写的值对于R来说,是“可能”看见的。(这好像法律条文——凡是没有禁止的,都是可能做的)
注意1:这里需要提出的一点是,HB关系和TB关系是没有必然联系的,也就是,如果A hb B, A不一定tb B, 反过来也一样, 如果A tb B, 不一定就有 A hb B, 这是通常容易混淆的。
注意2:从我们的定义中就可以发现,tb、sw的某些规则(前两条)、hb的某些规则(从sw演化而来的)都是依赖于某次特定的执行(execution)的,在这些情景下,脱离了这个前提,单纯的提A hb B还是C sw D都是没有意义的。
5. JMM现身
做了这么多铺垫,主角到现在还没有出现,作为导演鸭梨很大。前面已经介绍了HB关系模型,您可能认为这就是JMM了,其实是有微小差别的——JMM是一种更严格的HB模型。严格在哪里呢?JSR133中有一大段形式化描述,看得犯晕,即使我个人再喜欢装逼也万难再描述一遍,我用我的理解来做出简单的解释,请大牛们检查。我们看一个例子:
初始条件:x = y = 0
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]
Thread 1:
a = x; //A
if(a == 1) //B
y = 1; //C
Thread 2:
b = y; //D
if(b == 1) //E
x = 1; //F
看上去有点paradox的意思,你可能认为最终a = 0, b = 0是唯一的结果。但是,在HB模型中,不是这样的。让我们来看上面这个例子:我们没有对两个线程做任何同步,对于a,b,x,y的读写都是可能存在data race的。
插播一条data race的定义:对同一变量的两个操作A、B,如果至少有一个写操作,并且A、B不存在HB关系,则我们说两操作存在data race。
这里,我们把六个操作分别编号(其实6个操作可以再细分为很多个小操作,但这里不需要),我们从HB的定义中可知,同一线程中,A hb B,B hb C,D hb E, E hb F,但是,这个例子中,F和A并没有HB关系,根据HB一致性原则,那么A可以读到F的写入;同理,D可以读到C的写入——这是违背直觉的,但我们并没有违反HB的法律。所以在HB模型中,这是被允许的。
在JMM中,上述情景是被禁止的。而JMM是通过什么新的条文做到这一点的?我的理解是,只用了下面一条规则:
JMM附加规则:如果某一动作的发生与否不取决于任何data race的发生与否,那么,这个动作是可以被early committed的。
带着这条规则,我们再来看上述例子,显然,这样一来,F不能在A之前commit,因为他依赖于对y读写data race的发生,y又依赖x,绕回来了,总之,如果不发生竞争写入,则F不可能发生。如此一来,上述情景被禁止了。为了更好理解,我们再来看一个例子:
初始条件:x = y = 0
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]
Thread 1:
a = x; //A
y = 1; //B
Thread 2:
b = y; //C
x = 1; //D
看上去跟刚才那个例子差不多,但如果我告诉你在这个例子中,a = 1, b =1 就是可以被JMM接受的,你会不会感到惊讶?让我们再来检查我们的规则:同样,D和A没有HB关系,B和C没有HB关系,而且,对于附加规则,B、D动作的发生不依赖与任何data race, 即是说,有没有data race,我都可以发生,那么,所有限制性规则再次全军覆没,a = 1, b = 1 可以接受。
最后一个例子:
初始条件:x = y = 0
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]
Thread 1:
a = x; //A
b = a | 1; //B
y = b; //C
Thread 2:
c = y; //D
x = c; //E
这个例子就没有刚才那么直观了,现在的问题是a = b = c = 1是JMM可以接受的结果吗?直觉上说,你可能脱口而出,不可能,因为违反了附加规则:操作B依赖于x的data race,x依赖y……B不能提前commit。你很聪明,但是,遗憾的是,编译器比你还聪明。我们看,在B执行的时候,a的取值可能有哪些?没错,无非是0或者1,那么,作为一个比你还聪明的编译器,看出“B操作的本质无非是b = 1,这个操作不依赖于data race发生与否”这一事实,应该是情理之中吧。那么它就会做出优化,把上述代码变为:
div css xhtml xml Example Source Code Example Source Code [http://www.cnblogs.com/tomsheep/]
Thread 1:
a = x; //A
b = 1; //B
y = 1; //C
Thread 2:
c = y; //D
x = c; //E
现在,你还说他违反附加原则吗?因此这个情景是被JMM接受的。
上述是我对JMM一点皮毛的理解,主要参考资料:
1. JSR133
2. Addison Wesley, Java Concurrency in Practice ,Brian Goetz
3. 各路网文
分享到:
相关推荐
Java内存模型(JMM)是为了保证多线程环境下程序的正确性和可预测性而设计的一套规则和约定。JMM定义了程序中的变量如何从线程工作内存同步到主内存,以及如何从主内存同步到线程工作内存这样的关键行为。具体而言,...
书中深入讨论了Java内存模型(JMM),这是理解并发编程中数据同步和可见性问题的关键。Java volatile关键字、synchronized块和方法以及final字段在确保线程间通信一致性方面扮演着重要角色。此外,Java的Lock接口和...
Java内存模型详解JMM Java内存模型(Java Memory Model,JMM)是Java虚拟机(JVM)中的一种内存模型,它描述了程序中各个变量之间的关系,以及在实际计算机系统中将变量存储到内存和从内存中取出变量这样的底层细节...
Java内存模型(JMM,Java Memory Model)是Java平台中用于描述如何在多线程环境中管理内存的一套规范。它确保了并发编程时不同线程之间的数据一致性、可见性和原子性,以避免出现数据竞争和其他并发问题。以下是JMM...
这个"JAVA知识图谱"涵盖了Java开发中的核心概念和技术,包括JVM(Java虚拟机)、JMM(Java内存模型)、JUC(Java并发工具包)、NIO(非阻塞I/O)、Netty(高性能网络应用框架)、IOC( inversion of control,控制...
- **`Atomic`类**:Java并发库提供了`AtomicInteger`、`AtomicLong`等原子类,它们提供了线程安全的原子操作方法,如`getAndIncrement`等,用于保证操作的原子性。 #### 三、Java并发API简介 ##### 3.1 内置语言...
Java内存模型(Java Memory Model,简称JMM)是Java并发编程中的核心概念,它定义了Java程序中多线程间共享变量的访问规则。理解JMM对于编写正确、高效的并发程序至关重要。本文将深入探讨JMM的原理、特性以及如何在...
同时,它讲解了Java内存模型(JMM)和volatile、synchronized关键字的作用,这些都是理解Java并发行为的关键。 其次,书中涵盖了多种设计模式,如生产者-消费者模式、读写锁模式、双检锁模式(DCL)等,这些模式有...
1. 兼容性:确保你的智能手机硬件和操作系统与JMM3.0兼容,因为不是所有设备都能顺利运行Java模拟器。 2. 性能:Java应用通常比原生应用消耗更多资源,因此在性能较弱的手机上运行可能会有延迟或卡顿。 3. 应用获取...
Java内存模型,简称JMM(Java Memory Model),是Java虚拟机规范中定义的一个抽象概念,它描述了在多线程环境下,如何保证各个线程对共享数据的一致性视图。JMM的主要目标是定义程序中各个变量的访问规则,以及在...
Java内存模型(JMM)是并发编程中的核心概念,它通过定义线程与主内存之间的交互规则,确保了多线程程序的正确性和内存的一致性。理解JMM的工作原理和特性,对于编写高效、可靠的并发程序至关重要。通过使用volatile...
5. JAVA内存模型基础知识:JMM内存模型、顺序一致性、指令重排序、happens-before原则、as-if-serial、final内存语义、线程可见性、synchronized、volatile等。 6. 线程池基础知识:CachedThreadPool、...
其次,内存模型和可见性问题,Java内存模型(JMM)定义了线程之间如何共享和访问数据,`volatile`关键字可以确保变量在多线程环境中的可见性。 接着,我们讨论线程同步,这是防止数据竞争和保证数据一致性的重要...
4. **并发集合**:Java提供了线程安全的集合类,如ConcurrentHashMap、CopyOnWriteArrayList等,它们在内部实现了线程安全的操作,使得在并发环境下使用集合更加安全高效。 5. **并发工具类**:Java.util....
其次,要掌握Java内存模型(JMM)。JMM定义了线程之间的共享变量如何读写,以避免数据不一致性。volatile关键字、synchronized关键字以及final字段在保证可见性和有序性方面起着重要作用。 并发设计原则是编写高效...
Java内存模型(Java Memory Model, JMM)是Java平台中用于规范线程间通信和内存可见性的重要概念,它的目标是确保多线程环境下的正确同步。然而,原始的JMM存在一些严重的缺陷,导致了开发者在理解和实现线程安全时...
- **可见性**:Java提供了多种机制来保证可见性,如使用`volatile`关键字、synchronized块以及final字段。 - **有序性**:`volatile`关键字和synchronized块都可以用来禁止指令重排序,从而保证操作的顺序性。 ### ...
Java内存模型(JVM Memory Model,简称JMM)是Java语言规范中定义的一个抽象概念,它描述了在多线程环境下,各个线程之间共享变量的访问规则,以及在并发情况下如何保证数据的一致性。Java内存模型的主要目标是解决...
Java内存模型(JMM,Java Memory Model)是Java平台中用于定义线程间如何共享变量以及如何同步操作的重要概念。最新版的JMM模拟器提供了一种可视化的方式,帮助开发者理解并模拟Java内存模型的工作机制,这对于理解...
Java 内存模型(JMM)是Java虚拟机(JVM)规范中的一部分,它旨在确保多线程环境下,程序的正确性和可预测性。JMM处理的主要问题是内存的可见性和一致性,它定义了线程如何与主内存交互以及如何共享变量。 在计算机...