一、前言
长久以来,一直想剖析一下Java线程安全的本质,但是苦于有些微观的点想不明白,便搁置了下来,前段时间慢慢想明白了,便把所有的点串联起来,趁着思路清晰,整理成这样一篇文章。
二、导读
1、为什么有多线程?
2、线程安全描述的本质问题是什么?
3、Java内存模型(JMM)数据可见性问题、指令重排序、内存屏障
三、揭晓答案
1、为什么有多线程
谈到多线程,我们很容易与高性能画上等号,但是并非如此,举个简单的例子,从1加到100,用四个线程计算不一定比一个线程来得快。因为线程的创建和上下文切换,是一笔巨大的开销。
那么设计多线程的初衷是什么呢?来看一个这样的实际例子,计算机通常需要与人来交互,假设计算机只有一个线程,并且这个线程在等待用户的输入,那么在等待的过程中,CPU什么事情也做不了,只能等待,造成CPU的利用率很低。如果设计成多线程,在CPU在等待资源的过程中,可以切到其他的线程上去,提高CPU利用率。
现代处理器大多含有多个CPU核心,那么对于运算量大任务,可以用多线程的方式拆解成多个小任务并发的执行,提高计算的效率。
总结起来无非两点,提高CPU的利用率、提高计算效率。
2、线程安全的本质
我们先来看一个例子:
public class Add {
private int count = 0;
public static void main(String[] args) {
CountDownLatch countDownLatch = new CountDownLatch(4);
Add add = new Add();
add.doAdd(countDownLatch);
try {
countDownLatch.await();
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(add.getCount());
}
public void doAdd(CountDownLatch countDownLatch) {
for (int i = 0; i < 4; i++) {
new Thread(new Runnable() {
public void run() {
for (int j = 0; j < 25; j++) {
count++;
}
countDownLatch.countDown();
}
}).start();
}
}
public int getCount() {
return count;
}
}
上面是一个把变量自增100次的例子,只不过用了4个线程,每个线程自增25次,用CountDownLatch等4个线程执行完,打印出最终结果。实际上,我们希望程序的结果是100,但是打印出来的结果并非总是100。
这就引出了线程安全所描述的问题,我们先用通俗的话来描述一下线程安全:
线程安全就是要让程序运行出我们想要的结果,或者话句话说,让程序像我们看到的那样执行。
解释一下我总结的这句话,我们先new出了一个add对象,调用了对象的doAdd方法,本来我们希望每个线程有序的自增25次,最终得到正确的结果。如果程序增的像我们预先设定的那样运行,那么这个对象就是线程安全的。
下面我们来看看Brian Goetz对线程安全的描述:当多线程访问一个对象时,如果不用考虑这些线程在运行时环境下的调度和交替,也不需要进行额外的同步,或者在调用方进行任何其他的协调操作,调用这个对象的行为都可以获得正确的结果,那么这个对象就是线程安全的。
下面我们就来分析这段代码为什么不能确保总是得到正确的结果。
3、Java内存模型(JMM)数据可见性问题、指令重排序、内存屏障
先从计算机的硬件效率说起,CPU的计算速度比内存快几个数量级,为了平衡CPU和内存之间的矛盾,引入的高速缓存,每个CPU都有高速缓存,甚至是多级缓存L1、L2和L3,那么缓存与内存的交互需要缓存一致性协议,这里就不深入讲解。那么最终处理器、高速缓存、主内存的交互关系如下:
那么Java的内存模型(Java Memory Model,简称JMM)也定义了线程、工作内存、主内存之间的关系,非常类似于硬件方面的定义。
这里顺带提一下,Java虚拟机运行时内存的区域划分
方法区:存储类信息、常量、静态变量等,各线程共享
虚拟机栈:每个方法的执行都会创建栈帧,用于存储局部变量、操作数栈、动态链接等,虚拟机栈主要存储这些信息,线程私有
本地方法栈:虚拟机使用到的Native方法服务,例如c程序等,线程私有
程序计数器:记录程序运行到哪一行了,相当于当前线程字节码的行号计数器,线程私有
堆:new出的实例对象都存储在这个区域,是GC的主战场,线程共享。
所以对于JMM定义的主内存,大部分时候可以对应堆内存、方法区等线程共享的区域,这里只是概念上对应,其实程序计数器、虚拟机栈等也有部分是放在主内存的,具体看虚拟机的设计。
好了,了解了JMM内存模型,我们来分析一下,上面的程序为什么没得到正确的结果。请看下图,线程A、B同时去读取主内存的count初始值存放在各自的工作内存里,同时执行了自增操作,写回主内存,最终得到了错误的结果。
我们再来深入分析一下,造成这个错误的本质原因:
(1)、可见性,工作内存的最新值不知道什么时候会写回主内存
(2)、有序性,线程之间必须是有序的访问共享变量,我们用“视界”这个概念来描述一下这个过程,以B线程的视角看,当他看到A线程运算好之后,把值写回之内存之后,马上去读取最新的值来做运算。A线程也应该是看到B运算完之后,马上去读取,在做运算,这样就得到了正确的结果。
接下来,我们来具体分析一下,为什么要从可见性和有序性两个方面来限定。
给count加上volatile关键字,就保证了可见性。
private volatile int count = 0;
volatile关键字,会在最终编译出来的指令上加上lock前缀,lock前缀的指令做三件事情
(1)、防止指令重排序(这里对本问题的分析不重要,后面会详细来讲)
(2)、锁住总线或者使用锁定缓存来保证执行的原子性,早期的处理可能用锁定总线的方式,这样其他处理器没办法通过总线访问内存,开销比较大,现在的处理器都是用锁定缓存的方式,在配合缓存一致性来解决。
(3)、把缓冲区的所有数据都写回主内存,并保证其他处理器缓存的该变量失效
既然保证了可见性,加上了volatile关键词,为什么还是无法得到正确的结果,原因是count++,并非原子操作,count++等效于如下步骤:
(1)、 从主内存中读取count赋值给线程副本变量:
temp=count
(2)、线程副本变量加1
temp=temp+1
(3)、线程副本变量写回主内存
count=temp
就算是真的严苛的给总线加锁,导致同一时刻,只能有一个处理器访问到count变量,但是在执行第(2)步操作时,其他cpu已经可以访问count变量,此时最新运算结果还没刷回主内存,造成了错误的结果,所以必须保证顺序性。
那么保证顺序性的本质,就是保证同一时刻只有一个CPU可以执行临界区代码。这时候做法通常是加锁,锁本质是分两种:悲观锁和乐观锁。如典型的悲观锁synchronized、JUC包下面典型的乐观锁ReentrantLock。
总结一下:要保证线程安全,必须保证两点:共享变量的可见性、临界区代码访问的顺序性。
阅读全文请点击
相关推荐
Java 模拟线程并发是编程领域中的一个重要概念,尤其在多核处理器和高并发应用中,理解并熟练掌握线程并发技术对于提升程序性能至关重要。在Java中,线程并发可以通过多种方式实现,包括继承Thread类、实现Runnable...
Java的BlockingQueue接口(如ArrayBlockingQueue)非常适合实现这一模型,它提供了线程安全的数据插入和移除操作。 在实例中提到的"全部开始 全部停止 单个停止"可能涉及到线程的启动和控制,这可以通过控制线程的...
### Java并发中的线程安全性 #### 1. 引言 随着Java技术的发展以及多核处理器的普及,Java并发编程成为软件开发中的一个重要领域。Java并发控制问题是国内外学者研究的热点之一,特别是在J2SE 1.5版本中引入了`...
通过Java实现一个高级功能可以涉及多个领域,比如并发编程、网络通信、大数据处理、机器学习等。压缩包文档代码将展示一个结合Java并发编程和线程安全的高级功能示例:一个线程安全的计数器。
Java并发多线程是Java编程中的重要组成部分,它允许程序同时执行多个任务,极大地提高了...在实际开发中,根据需求选择合适的方式实现并发,并充分考虑线程安全、性能和资源管理等因素,才能写出高质量的Java并发程序。
总之,Java的多线程和并发编程是一个复杂而重要的主题,它涉及到操作系统原理、JVM行为、线程管理、同步机制等多个方面,熟练掌握这些知识对于开发高效、可靠的Java应用程序至关重要。通过理解线程的工作原理和使用...
Java 高并发多线程编程系列案例代码 & 教程 & 面试题集锦! !! 包括但不限于线程安全性, atomic包下相关类、CAS原理、Unsafe类、synchronized关键字等的使用及注意事项,
本篇文章将深入探讨Java中的多线程并发机制,并通过具体的示例来帮助读者更好地理解和掌握这一重要概念。 #### 二、为什么需要多线程? 多线程技术的存在主要解决了计算机系统中资源利用率低下的问题。在没有多...
《Java并发编程实战》是Java并发编程领域的一本经典著作,它深入浅出地介绍了如何在Java平台上进行高效的多线程编程。这本书的源码提供了丰富的示例,可以帮助读者更好地理解书中的理论知识并将其应用到实际项目中。...
线程池是Java并发编程中的重要概念,它有效地管理和控制线程的创建和销毁,提高了系统资源的利用率。Java中,可以通过`Executors`类创建不同类型的线程池: 1. **固定大小线程池**:`newFixedThreadPool(int ...
在Java中,线程安全问题通常与并发、内存模型和可见性有关。Java内存模型(JMM)定义了如何在多线程环境下共享数据的规则,确保线程之间的正确交互。 线程安全可以分为三种类型: 1. 不安全:当多个线程访问共享...
Java多线程与并发编程是Java语言中用于处理多任务执行的关键技术,它能够帮助开发者设计出能够有效应对高并发请求的应用程序。在现代的线上(Online)和离线(Offline)应用中,合理利用多线程技术可以大幅提高系统...
Java线程与并发编程实践是Java开发者必备的技能之一,特别是在多核处理器和高并发应用环境中,有效地管理和利用线程能极大地提升程序的性能。本书《java线程与并发实践编程》由Jeff Friesen撰写,2017年2月出版,...
3. **原子类**:原子类是Java并发库中提供的一种高效的线程安全类,它们可以实现无需同步的原子更新操作。 - `AtomicInteger`:用于整型变量的原子操作。 - `AtomicLong`:用于长整型变量的原子操作。 - `...
这些集合确保了在多个线程访问时的数据一致性、完整性和安全性,避免了竞态条件、死锁和其他并发问题。Java提供了一系列的线程安全集合类,它们是专门为多线程环境设计的。 首先,我们要了解什么是线程安全。线程...
《Java并发编程实践》(JCIP)是一本深入讲解Java并发的经典书籍,其附带的示例代码可以帮助读者更好地理解和应用多线程技术。通过阅读这些示例,可以深入理解并发设计模式,如生产者-消费者模型、双端队列、线程池...