`
kyo100900
  • 浏览: 639806 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

深入理解JBoss Cache3.0——Naga

阅读更多

<!----><!----><!----> <!---->

原文请看: http://java.dzone.com/articles/a-look-inside-jboss-cache

 

 

作者 Manik Surtani 是开源项目 JBoss Cache 的领导人,本文主要是对 JBoss Cache3.0 —— Naga 一些全新技术的论述,其中也不乏对原有技术的回顾。总的来说,本文还是揭示了缓存的未来—— MVCC ,值得推荐。

 

 

 

 

正文

 

 

当我在 DZone 写完《 分布式,缓存与并行 》一文后,许人多次我为什么这么“厚着脸皮”的力挺我领导的 JBoss Cache 开源项目时,我想本文会给你们一个满意的答案。这篇文章将完全致力于 焕然一新的 JBoss Cache3.0 代号 Naga ),并且深入讨论我们的高性能并发模型。

 

 

   

Naga 的今生前世

   

在开始讨论 Naga 之前,我还是想简要的说说 JBoss Cache 的历史。大概在 2002 的时候,为了维持集群的高可用性, JBoss AS JBoss 应用服务器)需要提供一个专门为解决 HTTP EJB Session 状态复制的集群缓存方案 JGroups 是一款开源的成组通信 (group communication ) 项目。 Bela Ban JGroup 的创始人也是维护开发人员,对 JGroup 进行扩展,使其适应树形数据结构 ,并且还增加了一个缓存相关的特性: eviction JTA Transactions 。大约在 2003 年年初时,这个被扩展的树型结构迁移到了 JBoss AS CVS repository 中,从此成为 Jboss AS 中的一员。

 

 

时间齿轮又指向了 2005 3 月, JBoss Cache JBoss AS repository 中分离出来,单独形成一个项目。唉,那都是陈年旧事了。不过,像 cache loading( 缓存负载 ) ,多种缓存装载器的实现, eviction 策略, buddy replication(buddy 复制 ) 都是后来慢慢加入的。基于 TCP 的委托缓存服务器允许你构建多层缓存。当进行状态提制时, Custom marshalling 框架为比 Java 序列化机制提供了更高的性能。紧接着又迎来了 JBoss Cache2.0 的发布,这次的 API 改动很大,并且要求基于 Java5 。另外两个基于此核心缓存技术的 POJO版本 Searchable版本 也发展良好。

 

 

   

火炬交接

 

 

现在,是将 Jboss Cache2.* 系列的火炬转交给 Naga 了。这次 Naga 又有了很大的变化和改进, 除了资源管理和 marshalling 的全面提升,以及全新的简化配置文件格式外,它还包括至少一个革命性的改变: MVCC

 

 

 

 

MVCC 时代已经到来

 

MVCC 全称 Multi-versioned concurrency control( 多版本并发控制 ) ,在 Naga 中已经被采纳作为默认的并发解决方案。

 

 

当以本地方式运行时,对内存和 CPU 而言,缓存最大的开销就是使用锁来在保证共享数据完整性。而到了集群环境中,锁成了继 RPC 调用后的第二大开销“大户”。

 

 

 

 

对遗留的锁机制回顾

   

JBoss Cache1.* 2.* 时代,我们提供两种不同的锁方案——即乐观锁和悲观锁。它们各有千秋,但是从性能角度上来说,它们还是开销太大。

 

 

悲观锁用来锁住树中的每个结点。 Reader threads (读线程)可以得到一个非独占的 read locks( 读锁 ) ,而 writer threads( 写线程 ) 却可得到一个独占的 write locks( 写锁 ) ,从而独占这些结点。我们实现的锁是通过扩展 JDK ReentrantReadWriteLocks ,将其改进成为支持事务作用域内的锁更新——即一个线程可以开始时用 read locks 去读取一个结点,稍后再尝试用 write locks 着去更新它。(注意,悲观锁的读写是互斥的,无法同时进行的

 

 

总得来说,这种方案简单而且健壮,但由于内存要维护每个被锁的结点,所以从性能上说还不是很满意。更重要的是,如果结点已经被 read locks 锁住了,那么 write locks 就没办法再去操作它们了,使得并发性能下降。读操作阻塞写操作的后果还容易造成死锁。好吧,我们现在来看个例子:

 

“事务 A 提交前,对结点 /X 执行读操作,对结点 /Y 执行写操作。事务 B 恰恰与之相反,在提交前,对结点 /Y 执行读操作,对结点 /X 执行写操作。不幸的事发生了,事务 A 对结点 /X 用了 read lock ,并且还在等待时机去用 write lock 操作 /Y 结点;而事务 B 对结点 /Y 用了 read lock ,也还在等待时机去用 write lock 操作 /X 结点。这两个事务发生死锁了,直到其中的一方超时,然后事务回滚。”

 

 

为了克服潜在的死锁问题,我们提供了乐观锁。乐观锁对每个结点采用版本控制方式。它允许任意多个结点拷贝 (Nodes copied) 出现在一个事务中,并允许事务处理这些拷贝。结点拷贝为读操作提供了可重复读取的语义,同时还允许 writer threads 在不考虑读操作的情况下,进行相应的写操作。那些修改的结点会在事务提交时进行版本检查,确保没有新的并发写操作发生,最后将结点合并到缓存的 main tree 上去。

 

 

乐观锁提供了更高级别的并发机制来处理并发读写操作,而且还避免了死锁的风险。但它仍然有两个主要的缺点:一是性能问题。因为不断的将结点的状态拷贝到每个并发线程所造成的内存和 CPU 开销是不容忽略的。二是尽管并发时允许了写操作,但是一旦发现数据的版本不对,事务提交时不可避免的还是会失败。也就是说,此时写事务虽然可以不受限制的进行大量处理和写操作,但是这样在事务结束的时候容易出现提交失败。

 

 

 

 

MVCC 有什么用

 

 

MVCC 提供了非阻塞 (non-blocking) 读操作 ( 它并不会去阻塞 wirter threads) ,在避免死锁的同时也提供了更高级的并发机制。它采用了 fail-fast 机制,如果写操作得到了一个 write lock ,那么它们也是依次进行,不允许重叠。最后我要说的是, MVCC 在内存使用率上也是可圈可点:它对所有的读操作只维护一个状态的拷贝;对依次顺序进行的写操作来说,每次的修改只会对版本号产生一次变化。更棒的是,我们的 MVCC 实现甚至可以对 reader threads 完全不采用任何锁 ( 对于像缓存这样频繁读取的系统来说,意义太大了 ) ,并且还允许自定义的为写操作实现独占锁。自定义锁完全摒弃了同步代码块,使用了最新的并发技术: compare-and-swap memory fencing( 使用 volatile variables 实现同步 ) 。所有的这一切都会让 MVCC 在性能和可伸缩性方面,成为一个更加出色的解决方案。

 

 

说了这么多,是该谈 MVCC 的细节了。

 

 

JBoss Cache MVCC 实现这所以这么高效在于 reading threads 之间不需要任何同步代码块或锁机制。对于每个 reader thread 来说,缓存将结点的状态包装在一个轻量级的容器对象(比如说 ThreadLocal )或者长事务中。所有的后继操作要想访问或操作缓存中的结点,都必须通过这个容器对象。甚至当结点的状态真的在并发时发生了变化,那么使用 Java 引用的使用也可以达到可重复读取的语义。(下文有具体的说明

 

 

从另一方面来看, write threads 首先需要获得一个锁后,才可执行写操作。现在,我们的做法是使用 lock striping (分离锁)来提升缓存的内存性能,而 shared lock pool( 共享锁池 ) 级别可以使用被锁定结点的 concurrencyLevel 属性来进行调整 ( 更多细节,请看 Jboss Cache的配置参考 ) 。在获得一个独占锁后,如同 reader threads 那样, writer thread 也会将要修改结点的状态包装在一个容器中,然后将它的状态拷贝出来,再进行写操作。注意,在拷贝状态的时候,指向原始结点的引用仍然是可以进行回滚操作的。当写操作即将完成时, writer thread 最终又将已经发生改变的拷贝的状态写回相应的数据结构中(比如说文件系统,数据库等,但是始终不会影响到在容器中的原始结点,感觉与 oracle 机制有点像) ,最后操作完成。

 

 

这样的话,假如一些现有的 reader thread 再次读取该结点时,发现其版本号已经更新了,它仍然会持有指向原来结点的引用,从而实现可重复读取的语义。

 

 

如果写操作在等待一定时间后,仍然无法获取 write lock 的话,一个 TimoutException 立即抛出。

 

 

尽管 MVCC 已经强行要求写操作必须先获得一个 write lock ,但是众所周知,即使是使用可重复读这一隔离级别,由于 write skew( 写偏斜 ) 所造成的幻读仍然有可能发生。当并发事务进行读写操作时,由于读操作会一直在事务上下文中持有结点的原始引用,那么就算接下的写操作就算已经将该结点给处理掉了,对于读操作来说也是透明的,那么幻读就发生了。

 

 

<!----><!----> <!---->

 

 

 

在拷贝结点状态准备进行写操作时,如果检测到 write skew ,那么默认的处理方式就是抛出一个 DataVersioningException 异常。尽管如此,对大多数并不苛刻的应用程序来说, write skew 也许不是什么问题而且出现这样的情况也是允许的。如果你的应用程序并不关心 write skew ,你可以将 writeSkewChecks 属性设置为 false ,完全不予理睬。看看文档,里面有关于 Jboss Cache 的配置细节。

 

 

需要注意的是,如果设置了 READ_COMMITTED 隔离级别时,线程总是会处理已经提交的结点,那么 write skews 就可以避免发生;当使用乐观锁时,无论使用何种隔离级别, write skews 都有抛出 DataVersioningException 异常的可能。

 

 

 

有什么可参考的 tutorial 吗?

   

当然。你们只要下载 JBoss Cache bosscache-core-all.zip 分发包,里面就有图文并茂的 tutorial 来帮你实现自己的缓存。 这里还有一个 GUI deom来更好的说明缓存

 

 

 

 

下载地址

 

 

总而言之, Naga JBoss Cache 最新也是最好的缓存产品了。无论对于读操作还是写操作,它都将提供更快速的访问方式;对于稳定与性能方面也将更加优异;更快速的复制,更少的内存消耗都可以让为你节省更多的时间。 下载 Naga请点击这儿 FAQ tutorial在这里下载

 

 

13
0
分享到:
评论
6 楼 quiii 2009-01-12  
  哎,看不懂 2
5 楼 SSailYang 2008-11-17  
哎,看不懂
4 楼 geweixin 2008-11-15  
真好。。。
3 楼 Evan520 2008-11-14  
我很丑,但是我也不温柔 写道

真好。。。

我很丑,但是我也不温柔 写道

真好。。。

我很丑,但是我也不温柔 写道

真好。。。

我很丑,但是我也不温柔 写道

真好。。。

我很丑,但是我也不温柔 写道

真好。。。

我很丑,但是我也不温柔 写道

真好。。。

2 楼 yifeng 2008-11-13  
支持,很好
1 楼 我很丑,但是我也不温柔 2008-11-13  
真好。。。

相关推荐

    jboss ejb3.0开发介绍

    ### jBoss EJB 3.0 开发指南 #### 一、引言 随着 Java 技术的发展,企业级应用的复杂度不断提高,EJB(Enterprise JavaBeans)作为 Java EE 标准的一部分,在构建分布式系统方面扮演着重要的角色。EJB 3.0 相较于...

    JBoss EJB3.0实例教程

    通过《JBoss EJB3.0实例教程》这本书,读者可以深入理解EJB3.0的各种概念,并通过实际案例学习如何在JBoss环境下创建、部署和运行EJB组件。书中可能涵盖了诸如数据库连接池、消息驱动bean(Message Driven Bean, MDB...

    JBoss EJB 3.0 Tutorial

    JBoss EJB 3.0 Tutorial

    jboss EJB 3.0 实例教程

    jboss EJB 3.0 实例教程 (黎活明 著) (pdf书籍) 及 (代码).......

    JBOSS EJB3.0实例教程

    - Java EE 开发者,尤其是那些希望深入理解EJB3.0的企业级应用开发。 - 高级Java程序员,希望扩展其技能树并掌握EJB3.0技术栈。 - 学生和技术爱好者,对Java企业级开发感兴趣,希望通过实际案例加深理解。 #### 二...

    Jboss EJB3.0 实例教程.pdf

    - **适用人群**:本教程适用于初学者及具有一定Java基础的学习者,特别是那些希望深入了解并掌握EJB 3.0技术的开发者。 - **内容特色**:通过实例教学的方式,帮助读者从实践中学习和掌握EJB 3.0的核心概念和技术...

    jboss EJB3.0实例教程

    【EJB3.0简介】 EJB(Enterprise JavaBeans)是Java EE平台中的核心组件,用于构建企业级应用。...教程中的`EJB3.pdf`很可能包含了详细的实例讲解,从基础概念到实战演练,帮助你深入理解并掌握EJB3.0的精髓。

    Jboss EJB3.0教程

    - **适用人群**:本书适用于对Java EE技术有一定了解的开发者,特别是那些希望深入学习并掌握JBoss环境下EJB3.0技术的读者。 - **教程目的**:旨在通过实践案例帮助读者掌握EJB3.0的核心技术和最佳实践。 #### 二、...

    jboss-web-3.0.0-beta-2.zip_beta_jboss_jboss web 3.0_jboss-web

    1. **Servlet容器**:作为基础的Tomcat,JBoss Web支持Servlet规范的最新版本,可能是Servlet 3.0或更高,这允许开发人员利用更高级的特性,如异步处理、过滤器链的优化以及更灵活的部署配置。 2. **JSP支持**:...

    JBoss 3.0 Quick Start Guide

    ### JBoss 3.0 快速入门指南 #### 概述 《JBoss 3.0 快速入门指南》是一本专为希望...通过本书的学习,开发者不仅可以了解如何安装和配置 JBoss 3.0,还能深入理解如何利用 JBoss 开发和部署复杂的企业级应用程序。

    用JBOSS CACHE 做CAS集群在weblogic上部署的问题

    6. **故障排查**:在部署过程中可能会遇到各种错误,如连接失败、序列化异常等,解决这些问题需要对WebLogic、JBOSS CACHE以及CAS的原理有深入理解。 7. **监控和日志**:部署后,监控系统性能和日志,及时发现并...

    Advanced JBoss Cache

    JBoss Cache是一款功能完备的企业级开源缓存引擎,它具备事务性、分布式/复制、持久性、自愈性、可插拔/可扩展性以及高度可配置/可调性等特点。JBoss Cache最早以复制java.util.HashMap的演示项目开始,使用了LGPL...

    JBoss3.0快速入门指导

    【JBoss3.0快速入门指导】 JBoss是Red Hat公司开发的一款开源的应用服务器,它基于Java EE(Enterprise Edition)规范,提供了全面的企业级应用程序部署和管理解决方案。JBoss3.0版本是JBoss发展历史上的一个重要...

    使用jboss cache 作为pojo cache

    通过案例分析,我们可以更深入地理解如何在分布式环境中利用这些关键特性。 总之,JBoss Cache作为POJO Cache,为开发者提供了一种高效、灵活且易于使用的缓存解决方案,解决了简单缓存系统的局限性,并提升了整体...

    jboss教程——快速上手指南

    【JBoss教程——快速上手指南】 JBoss,全称为Red Hat JBoss Middleware,是由Red Hat公司开发的一款开源中间件服务器,它基于Java EE(Java Platform, Enterprise Edition)标准,提供了一个全面的企业级应用...

    servlet3.0+jboss7+jsp+Mysql5.0+IDEA13 登录注册(jar包,css齐全)

    在本项目中,我们主要探讨的是一个基于Servlet 3.0、JBoss 7应用服务器、JSP(JavaServer Pages)、MySQL 5.0数据库以及IntelliJ IDEA 13集成开发环境的登录注册系统。这个系统包含了完整的CSS样式,确保了用户界面...

    JBoss Cache

    ### JBoss Cache 相关知识点 #### 一、概述与定义 **JBoss Cache** 是一个功能强大的集群式缓存解决...以上是对 JBoss Cache 相关知识点的一个较为详细的概述,希望能帮助读者更好地理解 JBoss Cache 的功能和用法。

    Hibernate Jboss cache

    在深入探讨具体的配置细节之前,我们先来了解一下使用Jboss Cache作为Hibernate二级缓存时涉及的一些核心概念: - **缓存中的数据类型**: - **实体**:缓存中存储的实体对象。 - **集合**:与实体相关的集合属性...

Global site tag (gtag.js) - Google Analytics