`
- 浏览:
423330 次
- 性别:
- 来自:
上海
-
引用
多线程模型是主流的并发编程模型。在过去几十年来,多线程模型一直是开发并发程序的有力工具。然而,它的历史并非总那么美好。1997年,NASA 的“火星探路者”号在执行任务的途中遭遇了严重的时序异常(参见 “What really happend on Mars“,注目 follow-up 中的现身说法),无法发回探测数据。如果不是 NASA 远程刷新了程序,它的结局就只能是报废在火星上。这一切都是由程序中潜藏的一个优先级反转 bug 造成的。更早的例子还有80年代的一系列 Therac-25 型医用粒子加速器事故。在这些加速器释放出的过量辐射照射之下,数位病人死亡。事后调查显示,至少有一次发生事故的原因,是加速器的控制软件中,存在一个只能由特定操作序列引发的竞争条件 bug。你也许认为这些只是陈年往事,但是直到现在,即便是世界500强公司们高价买来的信息系统,也同样避免不了这些问题。这导致许多程序员认为线程是个潘多拉魔盒,对它采取能躲就躲的态度。然而近来计算机的发展使得躲猫猫的空间越来越小:随便从市场上淘一个CPU,它里面也有不止一个核心。未来的程序员只会有越来越多的机会接触到并发编程,而无法再独善其身了。
加州大学伯克利分校教授,爱德华 A. 李在2006年做了一次题为《线程的麻烦 (The Problem with Threads)》的学术报告。在报告中他提到:看上去,多线程只是对核心语言的小小扩展,甚至可以以第三方库的形式存在。但实质上,多线程程序和原有的核心语言编写的程序已经完全不同了。其原因在于,由于多线程程序可能以任意的次序交错执行,程序再也无法像顺序执行时那样产生确定的结果。多线程程序容易编写(因为写的是顺序程序),但是难分析,难调试,更容易出错。
在我的想法中,产生问题的根源,是多线程模型作为对并发问题的一个抽象,是很不完善的。抽象的实质是对问题的转换。我们可以把抽象应用于一个问题,把它转换成另一个(或许)更简单的问题来解决。解决了转换后的简单问题,就意味着解决了原有的困难问题。严格来说,一个抽象一定要保存原有问题的结构,同时去除无关细节。但是,由于我们生活的世界并没有什么东西是完全“严格”的,现实中使用的抽象有时会隐藏解决问题的关键细节,或者残留一些不该漏出来的东西。评价一个抽象的好坏,也就不止是看它能节省多少代码,和它的界面有多优美这么简单,同时还要看看在一个问题被抽象转换之后,留了下来的细节还能不能好好地解决它。
我们可以从这个意义上理解为什么线程模型是个很糟糕的抽象。一方面,对解决问题很关键的细节(如执行次序)被隐藏起来并受到了粗暴的对待。另一方面,线程模型极力兼容顺序程序的设计思想也使得如共享变量这样的,与线程不兼容的细节依然残留在程序员们的视线之内。我们无力控制程序的执行次序,而我们程序的正确性却依赖于对共享变量的有序变更。可以说,线程提供给我们的抽象简直是千疮百孔。我们还能用它干活,只是因为我们手里还有加锁机制,而它可以部分地堵上线程模型的漏洞。讽刺的是,引入加锁机制解决问题的同时,又带来了新的问题,所以我们编写多线程程序总会遇上死锁,活锁,优先级反转……等等。
同样作为并发编程问题的抽象,角色模型(Actor Model) 比线程模型好就好在,它的资源分享不像线程模型那样通过共享变量来进行。角色模型中的资源分享只能通过特定的机制(消息传递)来进行。你在角色模型里依然可能犯错误,如你可能制造死锁,也有可能造成优先级反转。但是没有共享变量就意味着没有了竞争条件,所以绝大部分资源也用不着上锁了。这样一来,原先至关重要的细节变得不那么重要,问题就这么解决了。
一般来说,在修复一个糟糕的抽象时,可以采取的策略分如下两类:
把造成问题的那部分抽象拿掉,直接露出底层的细节
换一个和底层兼容性更好的抽象模型
以 MapReduce 为例,它在解决分布式计算问题时,采取的是第一类策略。与现时流行的做法相反,MapReduce 并不试图制造计算是在单一场所完成的假象(流行话讲叫“云计算”),相反它需要程序员自己把问题拆分到集群中不同的机器上。同时,它却隐藏了大量其他细节。这种另类策略导致批评 MapReduce “太底层,不通用” 的声音不绝于耳, 然而这正是 MapReduce 聪明的地方。它放弃面面俱到,集中精力于高效地解决一小类问题(这类问题与排序问题有类似的结构),同时对其他的问题故意视而不见。它的流行证明了这一策略的成功。
角色模型,通信进程(Communicating Sequential Processes, CSP),以及函数式编程(FP)在应对并发编程问题时不约而同地选择了第二类策略。它们采用了与并发兼容性更好的抽象。角色模型与通信进程从线程模型的问题中抹去了共享变量,纯粹 FP 则抹掉了“变量”的可变性。CSP 还可以降低程序执行次序的不确定性(因为在CSP中执行次序默认是确定的,不确定性必须在程序设计时显式声明)。由于这些努力,这几种模型都避免了落入线程模型的麻烦中,得到了对并发问题的更优美的解法。我们可以说,这些模型提供的抽象比线程模型的都要好。很遗憾的是,它们尽管优美,但却乏人问津。角色模型与通信进程目前不被任何主流操作系统原生支持(微软在 Windows 7 附带的新并行运行时 ConcRT 中加入了基于角色模型的 Asynchronous Agents Library,使得状况稍微改观了一点)。FP 的年岁几乎和计算机语言的历史一样古老, 但它的市场份额直到现在也小得可怜。
也许一切都是因为线程模型表面上那迷惑人的简单性,以及墨菲定律的变体:布劳尔技术惯性定律(已经成功的技术在新的,更好的技术出现时也会赖着不走)。我们曾经接纳了一个有缺点的解决方案,而现在我们被捆绑在这个方案上了。我们为线程模型写了成百上千万行的代码,而现在这些代码的重量束缚住我们的手脚,使得我们无法前行。
解决线程模型带来的问题的正确做法,是推广新的,更完善的模型。既然解决问题的阻碍同时来自于新技术的低认知度和现有代码的拖累,很自然地有两个方面的工作要做。一、使得新技术更容易被多数程序员使用,二、想办法让现有的代码和新技术兼容。
在兼容老代码这一头,我们已经有了一些行动。微软在 Windows 7 中提供一个称为用户模式调度 (UMS) 的功能。UMS 可以将内核模式的线程转换为用户模式线程,而应用程序可以自己提供一个 UMS 调度器来调度它们。这意味着,我们现在有机会重载掉系统调度器的默认行为,而根据应用自身的特点给出更合理的调度安排来。这个功能可以用在构造更容易使用的并发模型上,这样开发的模型可以与老代码兼容(但 UMS 有一个让人迷惑的限制:只能用在64bit 的Windows 7 版本上)。
同样地,在推广新技术方面,现在也有了很多成果。除了角色模型外,事务性内存(这又是一种避免竞争条件,从而避免加锁的方法)正在研究中;CSP 已经有了数个实现(如由 Kent 大学开发,针对 Java 的 JCSP),同时还有针对 CSP 的模型检证工具;至于 FP,最近因为人们认为 Web 系统的建模可以在函数式编程范式中更好的表达,FP 正在唤起人们的注意。我们缺的只剩下新技术的成功应用范例(实际上,前面的技术并不是没有成功范例,我们缺的是经验能够大规模运用的范例 ),以及一支理解这些技术的程序员大军了。对于这后一条,我甚至想,既然多线程编程唯一”容易”的事情是写代码,何不做出一种工具来让程序员们可以用写顺序程序的思维来在这些新模型中编写程序呢?这样的工具会帮助程序员利用线性程序的思维来理解代码,但是同时又让人注意到自己的改动正在影响系统的哪一部分。如果新模型的代码变得好理解了,也许更多的人会使用它们。
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
【标题】:“多线程文件下载CS结构转载” 在计算机编程中,尤其是涉及到网络通信时,多线程技术是提高程序效率和响应性的重要手段。本文将深入探讨一种客户端-服务器(Client-Server,简称CS)架构下的多线程文件...
通过创建多个线程,每个线程处理一个客户端连接,这样可以提高服务器的并发性能,避免单线程模型中处理新连接时阻塞的问题。多线程技术使得程序能同时执行多个任务,提高整体效率。 “阻塞式”是指在进行网络I/O...
"Activex多线程和自动调整大小源码,本资源转载于博客园,上传防止原地址失效!" 这段描述告诉我们,这个资源可能是一个开发者在博客园上分享的代码示例,被转存在这里以备不时之需,可能是由于原始链接可能会失效。...
- **Apache MINA 线程模型配置 .shtml**:这部分内容可能详细讲解了MINA中的线程模型配置,如何根据应用场景选择合适的线程模型以优化性能。 - **MINA使用手记[1] _files**:这个目录可能包含了与第一篇使用手记相关...
2. **线程模型**:muduo库实现了主-从线程模型,主线程负责接收连接请求,而工作线程处理实际的业务逻辑。这种设计有助于避免锁竞争,提高并发性能。 3. **类库结构**:muduo库通常包含网络层(如TcpServer、Event...
从【压缩包子文件的文件名称列表】"【转载】可扩展多线程异步Socket服务器框架EMTASS 2_0 - 个人开发历程知识库 - 博客园.mht"来看,这可能是一个关于EMTASS框架的详细教程或开发者笔记,记录了作者在开发2.0版本...
Hotspot使用native线程模型,线程的创建、调度、同步等操作直接与操作系统接口交互,提供了高效且低延迟的线程支持。 8. **动态适应性** Hotspot可以根据程序的运行状况动态调整各种参数,如堆大小、编译阈值等,...
这篇转载的博客文章探讨了如何在`JTable`中实现分页功能。 首先,理解`JTable`的基本结构至关重要。`JTable`是基于`DefaultTableModel`的,它管理表格的数据、列名和行数。为了实现分页,我们需要创建一个自定义的`...
在计算机编程领域,Windows编程是一项重要的技能,尤其对于程序员来说,深入理解Windows操作系统的工作原理和编程模型至关重要。本文将基于标题和描述中的内容,介绍两本经典书籍——《Windows程序设计(第5版)》和...
- 为了响应用户的输入和系统事件(如窗口大小改变),程序可能采用了事件驱动编程模型,可能使用Windows API或其他跨平台的事件处理库。 5. **图形渲染**: - 飘雪粒子系统:每个雪花可以看作是一个粒子,粒子...
4. **Apache MINA 线程模型配置 .shtml**:这部分内容可能专注于MINA的线程模型,MINA支持多种线程模型,如NIO多路复用器、简单的线程池等,以优化性能和并发处理能力。 5. **NIO_TEST**:这可能是一些与Java NIO...
COM+是微软的组件对象模型(Component Object Model)的一个扩展,它提供了一种集成服务的环境,包括事务处理、安全性、生命周期管理等,使得在多层应用中开发组件更为便捷。 在这个实战项目中,作者以订单维护为例...
Vert.x最大的特点就在于异步(底层基于Netty),通过事件循环(EventLoop)来调起存储在异步任务队列(CallBackQueue)中的任务,大大降低了传统阻塞模型中线程对于操作系统的开销。因此相比较传统的阻塞模型,异步...
标题"转载的一个侧滑删除"表明这是一个关于实现这种功能的资源包,可能是代码示例、库或者教程,而"描述"则说明了这个资源已经上传到某个平台,用于保存和分享。 侧滑删除通常应用于Android和iOS平台上的应用,特别...
- **单线程模型**:Node.js采用单线程模型来处理请求,这与传统的多线程模型不同,能够有效提高资源利用率。 - **模块化设计**:Node.js提供了一套丰富的内置模块,如fs(文件系统)、http(HTTP服务)等,方便...
- **监听器和事件**:在处理客户端连接和消息接收时,可能会用到事件驱动模型,通过监听特定事件来触发相应操作。 9. **TCP/IP协议**: - **连接可靠性**:局域网聊天软件基于TCP/IP协议,保证数据的可靠传输,...
3. **事件处理**:C#的事件驱动模型使得用户交互变得简单。例如,当用户点击图案时,程序会触发一个Click事件,调用相应的事件处理函数,进行图案匹配检查。 4. **数据结构**:为了存储和操作盘面状态,开发者可能...
5. **多线程与异步编程**:为了保证软件的响应速度,开发者可能使用了多线程或异步I/O模型(如asyncio库),使得程序在执行模拟操作的同时,还能处理用户的其他输入。 6. **版本控制**:GitHub作为版本控制系统,...
【Java】在Java部分,面试可能涵盖基础语法、面向对象编程、集合框架、多线程、异常处理、IO流、JVM内存模型以及设计模式等方面。例如,可能会问到如何优化代码性能,如何处理并发问题,或者对Java 8的新特性如...