转载:从JVM并发看CPU内存指令重排序
原文地址:
http://kenwublog.com/illustrate-memory-reordering-in-cpu
对主存的一次访问一般花费硬件的数百次时钟周期。处理器通过缓存(caching)能够从数量级上降低内存延迟的成本这些缓存为了性能重新排列待定内存操作的顺序。也就是说,程序的读写操作不一定会按照它要求处理器的顺序执行。
内存屏障重要性 通过cache降低内存延迟 为了性能重排序内存操作顺序
从图中可以看到,这是一台配备双CPU的计算机,cache 按地址被分成了两块 cache banks,分别是 cache bank0 和 cache bank1。
理想的内存访问指令顺序:
1,CPU0往 cache address 0×12345000 写入一个数字 1。因为address 0×12345000是偶数,所以值被写入 bank0.
2,CPU1读取 bank0 address 0×12345000 的值,即数字1。
3,CPU0往 cache 地址 0×12345100 写入一个数字 2。因为address 0×12345100是奇数,所以值被写入 bank1.
4,CPU1读取 bank1 address 0×12345100 的值,即数字2。
重排序后的内存访问指令顺序:
1,CPU0 准备往 bank0 address 0×12345000 写入数字 1。
2,CPU0检查 bank0 的可用性。发现 bank0 处于 busy 状态。
3, CPU0 为了防止 cache等待,发挥最大效能,将内存访问指令重排序。即先执行后面的 bank1 address 0×12345100 数字2的写入请求。
4,CPU0检查 bank1 可用性,发现bank1处于 idle 状态。
5,CPU0 将数字2写入 bank 1 address 0×12345100。
6,CPU1来读取 0×12345000,未读到 数字1,出错。
7, CPU0 继续检查 bank0 的可用性,发现这次 bank0 可用了,然后将数字1写入 0×12345000。
8, CPU1 读取 0×12345100,读到数字2,正确。
通过对指令重排,CPU可以获得更快地响应速度,但也给编写并发程序的程序员带来了诸多挑战。
内存屏障是用来防止CPU出现指令重排序的利器之一。
不同架构下的指令重排优化
从图中,可以看到,X86仅在 Stores after loads 和 Incoherent instruction cache pipeline 中会触发重排。
分享到:
相关推荐
2016-11-09(不点) 0x8205 bit 5 = 1: 使checkkey闲置循环停止指令。 2016-04-13(yaya) 支持动画菜单 setmenu --graphic-entry=类型=菜单行数=菜单列数=图形宽(像素)=图形高(像素)=菜单行间距(像素) 菜单项0...
3. 连杆工艺设计并编制工艺规程卡片一套(2010-11-15~2010-11-28) 4. 设计某工序加工的专用夹具一套(2010-11-29~2010-12-12) 5. 编写设计说明书(2010-12-13~2010-12-19) 6. 指导老师检查设计并修改及准备...
ISO/IEC 7816-1:1998 Identification ...ISO/IEC 7816-15:2004 Identification cards — Integrated circuit cards — Part 15: Cryptographic information application". Iso.org. 2007-06-20. Retrieved 2011-11-12.
2010-11-15 围棋学习2.39版相对于2.38版更新说明: 1、继续优化了基础智能类眼形算法,使之对于眼位的急所和常规情况区别对待,并填补了旧算法遗漏的对打劫眼形的处理。 2、修正了基础智能类三步包吃和三步吃子...
2010-01-22 11:21 1,026,811 418810-AA4.pdf 2009-03-20 15:10 2,115,171 438862-KA2HP System Management Homepage 安装指南(2009 年 3 月).pdf 2010-01-22 11:16 2,162,012 5187-2211.pdf 2008-06-10 23:20 2,...
2010-11-27 01:15 391091 346562 ERP5.0包装物管理系统需求规格说明书.pdf 2010-11-27 01:15 338535 300650 ERP5.0包装物管理系统业务需求调研说明书.pdf 2010-11-27 01:15 449944 400549 ERP5.0财务分析管理需求...
2010-01-22 11:21 1,026,811 418810-AA4.pdf 2009-03-20 15:10 2,115,171 438862-KA2HP System Management Homepage 安装指南(2009 年 3 月).pdf 2010-01-22 11:16 2,162,012 5187-2211.pdf 2008-06-10 23:20 2,...
新版完整标准 IEC 60747-1 2010.pdf
**VC++ 2010 至 2017 安装教程及知识点** Microsoft Visual C++(简称VC++)是微软公司开发的一款用于创建Windows应用程序和游戏的集成开发环境,尤其在处理C++编程语言时表现出强大的功能。本教程涵盖了从VC++2010...
ShopMX采用.NET+MSSQL进行开发,拥有...ShopMX V1.3 Time:2010-11-15 [优化] 1、 优化网站整体承载量; 2、 对购物车页面进行流程优化,提升操作速度。 3、 提升网站整体速度,调用数据库更加快速。
15. 无连接协议确认:OSI模型下层使用无连接协议时,通常不负责数据确认,而是由上层的面向连接的服务或协议来确认,如TCP。 16. 网络层编址特点:网络层编址(如IP地址)使用分层结构,识别网络部分,并区分每台...
15. 在Word文档中有一段落的最后一行只有一个字符,想把该字符合并到上一行,可以减少页的左右边距、减小该段落的字体的字号、减小该段落的字间距、减小该段落的行间距等方法实现。 16. 在Word中,关于分栏操作的...
11. 网络和系统管理: 文档中提到了IP地址、FTP(文件传输协议)、VLAN(虚拟局域网)、NTP(网络时间协议)和DNS(域名系统)。这些都是构建和管理云计算中心的基础网络组件和服务。 12. 存储管理: 提到了LUN...
2. **Visual C++ 2010 (VC10)**:此版本进一步增强了对C++11标准的支持,并引入了新的并发编程模型,如任务并行库(TBB)和异步代理。它还改进了编译器和调试器,优化了生成的代码,以及对64位平台的更好支持。 3. ...
该标准在2010年6月17日获得IEEE SA Standards Board批准,并于同年7月15日正式发布。 ### 二、802.11p的关键特性与应用场景 #### 1. **关键特性** - **频段**:802.11p工作在5.9GHz的ISM(工业、科学和医疗)频段...
标题中的“o15-ctrremove Office卸载工具.zip”是指一个包含微软官方Office卸载程序的压缩文件。这个工具的主要功能是帮助用户彻底卸载不同版本的Microsoft Office,包括Office2003、Office2007以及Office2010等。在...
第二次增量导出时(2010-11-15 09:10:30.221),我们需要找出所有在上一次导出后有变动的记录。记录2(李四)因为被修改,所以需要导出;记录5(方七)是新添加且未修改的,也需导出;记录6(张飞)虽然也是新添加的...
2012-06-11 16:03 0 1.txt 2012-06-11 15:20 42,528 c#仿QQ好友界面.rar 2012-06-11 15:22 216,281 ChineseChessV1.rar ...2012-06-11 15:38 299,008 (HDUACM2010版_06)并查集(最小生成树).ppt
【一级模拟office2010题(11-15)】是一套针对福建省计算机等级考试的一级考试的模拟试题,主要聚焦于Office 2010的应用技能。这套题目旨在帮助考生熟悉并掌握在实际操作环境中使用Office 2010的各项功能,包括Word...