`

多核线程笔记-java内存模型详解

阅读更多

内存模型 (memory model) 

 

内存模型描述的是程序中各变量(实例域、静态域和数组元素)之间的关系,以及在实际计算机系统中将变量存储到内存和从内存取出变量这样的低层细节.

 

 

 

不同平台间的处理器架构将直接影响内存模型的结构.

在C或C++中, 可以利用不同操作平台下的内存模型来编写并发程序. 但是, 这带给开发人员的是, 更高的学习成本.
相比之下, java利用了自身虚拟机的优势, 使内存模型不束缚于具体的处理器架构, 真正实现了跨平台.
(针对hotspot jvm, jrockit等不同的jvm, 内存模型也会不相同)

内存模型的特征: 
a, Visibility 可视性 (多核,多线程间数据的共享)
b, Ordering 有序性 (对内存进行的操作应该是有序的)

java 内存模型 ( java memory model )

根据Java Language Specification中的说明, jvm系统中存在一个主内存(Main Memory或Java Heap Memory),Java中所有变量都储存在主存中,对于所有线程都是共享的。

每条线程都有自己的工作内存(Working Memory),工作内存中保存的是主存中某些变量的拷贝,线程对所有变量的操作都是在工作内存中进行,线程之间无法相互直接访问,变量传递均需要通过主存完成。
java内存模型

其中, 工作内存里的变量, 在多核处理器下, 将大部分储存于处理器高速缓存中, 高速缓存在不经过内存时, 也是不可见的.

jmm怎么体现 可视性(Visibility) ? 
在jmm中, 通过并发线程修改变量值, 必须将线程变量同步回主存后, 其他线程才能访问到.

jmm怎么体现 有序性(Ordering) ? 
通过java提供的同步机制或volatile关键字, 来保证内存的访问顺序.

缓存一致性(cache coherency)

什么是缓存一致性? 
它是一种管理多处理器系统的高速缓存区结构,其可以保证数据在高速缓存区到内存的传输中不会丢失或重复。(来自wikipedia)

举例理解:
假如有一个处理器有一个更新了的变量值位于其缓存中,但还没有被写入主内存,这样别的处理器就可能会看不到这个更新的值.

解决缓存一致性的方法? 
a, 顺序一致性模型:
要求某处理器对所改变的变量值立即进行传播, 并确保该值被所有处理器接受后, 才能继续执行其他指令.

b, 释放一致性模型: (类似jmm cache coherency)
允许处理器将改变的变量值延迟到释放锁时才进行传播.

jmm缓存一致性模型 – “happens-before ordering(先行发生排序)”

一般情况下的示例程序:

x = 0;
y = 0;
i = 0;
j = 0;

// thread A
y = 1;
x = 1;

// thread B
i = x;
j = y;

在如上程序中, 如果线程A,B在无保障情况下运行, 那么i,j各会是什么值呢?

答案是, 不确定. (00,01,10,11都有可能出现)
这里没有使用java同步机制, 所以 jmm 有序性和可视性 都无法得到保障.

 

happens-before ordering( 先行发生排序) 

如何避免这种情况?

排序原则已经做到:
a, 在程序顺序中, 线程中的每一个操作, 发生在当前操作后面将要出现的每一个操作之前.
b, 对象监视器的解锁发生在等待获取对象锁的线程之前.
c, 对volitile关键字修饰的变量写入操作, 发生在对该变量的读取之前.
d, 对一个线程的 Thread.start() 调用 发生在启动的线程中的所有操作之前.
e, 线程中的所有操作 发生在从这个线程的 Thread.join()成功返回的所有其他线程之前.

 

为了实现 happends-before ordering原则, java及jdk提供的工具:
a, synchronized关键字
b, volatile关键字
c, final变量
d, java.util.concurrent.locks包(since jdk 1.5)
e, java.util.concurrent.atmoic包(since jdk 1.5)

使用了happens-before ordering的例子:
happens-before ordering

(1) 获取对象监视器的锁(lock)

(2) 清空工作内存数据, 从主存复制变量到当前工作内存, 即同步数据 (read and load)

(3) 执行代码,改变共享变量值 (use and assign)

(4) 将工作内存数据刷回主存 (store and write)

(5) 释放对象监视器的锁 (unlock)

注意: 其中4,5两步是同时进行的.

这边最核心的就是第二步, 他同步了主内存,即前一个线程对变量改动的结果,可以被当前线程获知!(利用了happens-before ordering原则)

对比之前的例子
如果多个线程同时执行一段未经锁保护的代码段,很有可能某条线程已经改动了变量的值,但是其他线程却无法看到这个改动,依然在旧的变量值上进行运算,最终导致不可预料的运算结果。

 

经典j2ee设计模式Double-Checked Locking失效问题 

双重检查锁定失效问题,一直是JMM无法避免的缺陷之一.了解DCL失效问题, 可以帮助我们深入JMM运行原理.

要展示DCL失效问题, 首先要理解一个重要概念- 延迟加载(lazy loading).

非单例的单线程延迟加载示例:

class Foo
{
private Resource res = null;
public Resource getResource()
{
    // 普通的延迟加载
if (res == null)
        res = new Resource();
return res;
}
}

非单例的 多线程延迟加载示例:

Class Foo
{
Private Resource res = null;
Public synchronized Resource getResource()
{
      // 获取实例操作使用同步方式, 性能不高
If (res == null) res = new Resource();
return res;
}
}

非单例的 DCL多线程延迟加载示例:

Class Foo
{
Private Resource res = null;
Public Resource getResource()
{
If (res == null)
{
       //只有在第一次初始化时,才使用同步方式.
synchronized(this)
{
if(res == null)
{
res = new Resource();
}
}
}
return res;
}
}

Double-Checked Locking看起来是非常完美的。但是很遗憾,根据Java的语言规范,上面的代码是不可靠的。

出现上述问题, 最重要的2个原因如下:
1, 编译器优化了程序指令, 以加快cpu处理速度.
2, 多核cpu动态调整指令顺序, 以加快并行运算能力.

问题出现的顺序:
1, 线程A, 发现对象未实例化, 准备开始实例化
2, 由于编译器优化了程序指令, 允许对象在构造函数未调用完前, 将 共享变量的引用指向 部分构造的对象, 虽然对象未完全实例化, 但已经不为null了.
3, 线程B, 发现部分构造的对象已不是null, 则直接返回了该对象.

不过, 一些著名的开源框架, 包括jive,lenya等也都在使用DCL模式, 且未见一些极端异常.
说明, DCL失效问题的出现率还是比较低的.
接下来就是性能与稳定之间的选择了?

DCL的替代 Initialize-On-Demand :

public class Foo {
    // 似有静态内部类, 只有当有引用时, 该类才会被装载
    private static class LazyFoo {
       public static Foo foo = new Foo();
    }
 
    public static Foo getInstance() {
       return LazyFoo.foo;
    }
}

维基百科的DCL解释:
http://en.wikipedia.org/wiki/Double-checked_locking

DCL的完美解决方案:
http://www.theserverside.com/patterns/thread.tss?thread_id=39606

总结:

多线程编程, 针对有写操作的变量, 必须 保证其所有引用点与主存中数据一致(考虑采用同步或volatile) .

分享到:
评论

相关推荐

    H:\大java后台笔记\蚂蚁课堂面试宝典\2018年蚂蚁课堂(每特教育)-Java工程师面试宝典-V1.0.docx

    - **Java内存模型(JMM)**: - 规定了一个线程对共享变量的写入对另一个线程可见的条件。 - JMM确保了数据的可见性和一致性,是多线程编程的基础。 以上是根据给定文件中的标题、描述、标签以及部分内容整理出来的...

    狂神说多线程详解.rar

    3. 用户线程和内核线程:用户线程由用户空间的库管理,而内核线程由操作系统管理,两者之间的映射关系取决于线程模型。 二、线程的创建与管理 1. 创建线程:通过API如Java的`Thread`类或C++的`std::thread`来创建新...

    Java 疑难杂症_笔记.pdf

    - **Jmm**是Java内存模型,定义了线程之间的内存可见性和同步规则。 #### Lambda语法 - Lambda表达式提供了一种简洁的方式来表示只有一个方法的接口的实例,增强了代码的可读性和可维护性。 #### Jdk8的方法引用 ...

    多线程笔记自用自用自用

    ### 多线程编程知识点详解 #### 一、并行与并发的概念理解 - **并行**:指多个任务在同一时间点上同时被执行。在硬件层面,这通常意味着多个处理器核心同时处理不同的任务。 - **并发**:描述的是程序的设计结构,...

    java并发笔记

    它引入了自动装箱、泛型、动态注解、枚举、可变长参数、增强for循环等功能,更重要的是,它改进了Java内存模型(JMM)并提供了`java.util.concurrent`并发包的部分功能。这是Java首次正式支持高级并发编程。 - **JDK...

    Java虚拟机讲解笔记.docx

    ### Java虚拟机(JVM)详解 #### 一、Java虚拟机概述与基本概念 Java虚拟机(JVM)是运行Java字节码的虚拟环境,它位于操作系统之上,硬件之下,提供了一层软件抽象,使得Java程序可以在多种平台上运行而无需重新...

    并发编程之一 日常学习笔记

    综上所述,这一系列学习笔记涵盖了并发编程的关键概念和实战技巧,包括Java内存模型、线程池、并发容器的使用以及常见数据结构的线程安全问题。通过深入学习这些内容,开发者可以更好地理解和解决多线程环境下的编程...

    ThreadX学习笔记.pdf

    ### ThreadX学习笔记知识点概述 #### 一、ThreadX启动过程详解 ThreadX是一个轻量级的实时操作系统(RTOS),广泛应用于嵌入式系统中。本节内容将深入解析ThreadX从启动到正常运行的全过程。 ##### 1. 注册中断向...

    VC++深入详解代码+笔记+勘误说明(20集全)

    6. **多线程编程**:在现代多核处理器环境下,多线程编程是提升程序性能的重要手段。学习线程的创建、同步、互斥量、信号量等概念,以及如何避免竞态条件,是提高程序并发能力的关键。 7. **网络编程**:VC++支持 ...

    JavaSE笔记1

    8. **多线程**:支持多线程编程,充分利用多核处理器的优势。 #### 五、Java开发环境设置 - **JRE**:Java运行时环境,包括JVM和核心类库。 - **JDK**:Java开发工具包,包含JRE以及开发工具。 **配置环境变量**...

    Multithreaded+Algorithms+Chapter

    ### 多线程算法知识点详解 #### 一、章节背景介绍 在《算法导论》第三版中,新增了一个非常重要的章节——多线程算法(Multithreaded Algorithms)。本书的作者包括Thomas H. Cormen、Charles E. Leiserson、...

    Memcached源码剖析笔记

    尽管 Memcached 本身是单线程模型,但它可以利用多核处理器的优势,通过部署多个实例来提高并发处理能力。 ##### 5.9 事件处理机制 Memcached 采用了 libevent 库提供的事件驱动机制来处理网络 I/O 和定时器任务,...

    linux_wlbc(jb51.net).rar

    - **并发处理**: 多进程和多线程模型可以充分利用多核CPU,而异步非阻塞I/O则可以减少线程上下文切换的开销。 - **负载均衡与性能优化**: 如连接池、缓存策略、预读取等技术,提升服务器性能。 4. **源码解读** ...

    C语言学习笔记(必看知识点).pdf

    C 语言学习笔记中的这些知识点涵盖了预处理指令、变量声明、内存管理、字符串处理、多核架构、函数指针以及非标准库的使用等多个方面。下面是对这些知识点的详细解释: 1. `define` 和 `ifndef` 是 C 预处理指令,...

    详解node child_process模块学习笔记

    NodeJs是一个单进程的语言,不能像Java那样可以创建多线程来并发执行。当然在大部分情况下,NodeJs是不需要并发执行的,因为它是事件驱动性永不阻塞。但单进程也有个问题就是不能充分利用CPU的多核机制,根据前人的...

    Styf学习笔记

    【Objective-C 知识点详解】 Objective-C,简称OC,是苹果公司开发的面向对象的编程语言,它是C语言的超集,具有Smalltalk式的消息传递机制。在iOS和macOS应用开发中,Objective-C是主要的编程语言之一。下面我们将...

    oplss-notes-2019:OPLSS 2019的笔记和讲义

    3. **并发与并行**:探讨线程、锁、信号量等并发控制机制,以及并行计算和多核处理器下的编程模型。 4. **分布式系统**:介绍CAP定理、分布式一致性、容错机制和云计算的基础知识。 5. **安全性与隐私**:涵盖加密...

    酷睿i7的官方文档和架构资料

    QPI是Intel推出的一种高速点对点互连技术,取代了传统的前端总线(FSB),提高了处理器与内存、I/O控制器之间的数据传输速度,降低了延迟。 **6. HT(Hyper-Threading)技术** HT技术让每个物理核心都能同时处理两...

Global site tag (gtag.js) - Google Analytics