`

J2EE集群原理 II

阅读更多

二. JNDI集群
Jndi集群对于EJB也是非常重要的,因为几乎所有的EJB都是从JNDI调用开始的
I. 共享全局JNDI树
Weblogic和JBOSS都使用一个全局的、共享的、分布在整个集群系统的JNDI树,对象被绑定到全局上下文,使用ip多播方式拷贝JNDI数据


图十四:全局共享JNDI
集群中的每个节点都有自己的命名服务器,并且自动保存其他所有节点的JNDI数据,因此这种结构具有高度可靠性
实际中,集群JNDI树主要有两个用途:一是用于部署,你只需要将某个EJB部署到一台服务器上,系统会自动将其拷贝到其他节点。二是在运行中你可以用JNDI存取自己的对象,这些自定义对象同样会被自动拷贝到其他节点。
II.独立的JNDI树
Sun JES, IBM Websphere和其他厂商使用的是独立的JNDI树,各个节点拥有自己独立的JNDI,而不会关心其他节点的JNDI。但这并不意味着它们不能实现集群,关键是每台服务器上的配置要相同,应用也要相同,这样的话通过代理agent就能实现高性能的集群了

Sun JES 和 IBM Websphere都在每个节点处安装了一个agent,由console负责协调各个agent
但这种方式不支持动态绑定运行时生成的对象,设计者的理由是:JNDI本身就是作为管理外部资源的中间层,运行时对象绑定不在JNDI的职责范围内,如果真的有这种需要,可以使用LDAP或者具有HA功能的数据库。Sun和IBM都有自己的LDAP实现

III. 中央型JNDI树
少数厂商采用中央型的JNDI,所有节点都去一个某个指定的JNDI服务器上获取资源,当然这对于客户端来说是透明的。不过这种方式会大大增加安装和管理的复杂性,因此被大部分厂商放弃

怎样开始连接JNDI呢
使用JNDI,你必须知道提供JNDI服务的域名或IP以及端口,在全局和独立型JNDI树中,都存在着多个JNDI服务器,客户端要连接哪一个呢,负载均衡和失败恢复又是如何实现的呢?

技术上来说,可以在客户端和JNDI服务器之间放一个硬件或软件实现的负载均衡器,来实现上述要求,不过大部分厂商都有更加简单的方法:

* SUN JES 和JBOSS 能够令“java.naming.provider.url”这一JNDI属性支持用逗号分隔多个地址,例如,“java.naming.provider.url=server1:1100,server2:1100,server3:1100,server4:1100”,客户端会逐个搜索,直到找到一个可用的为止

* JBOSS还支持自动找寻功能,即令“java.naming.provider.url”属性为空,客户端会自动以网络多播的方式寻找一个JNDI服务器作为查询的起始点


三. EJB集群原理
EJB衍生自分布式计算技术,服务器组件或富客户端都能够以标准协议(RMI/IIOP)调用远程的EJB,并且RMI/IIOP技术能够屏蔽底层网络,使得EJB的调用对客户透明化

图:EJB调用原理



如图,客户端不是直接和EJB打交道,而是通过stub来代理。Stub负责利用RMI找到远程的EJB并进行调用。EJB的调用过程分为下面三步(EJB2.0)

1.从JNDI中查找EJBHOME stub
2.利用home stub创建一个EJB Object stub
3.利用EJB Object stub调用EJB的方法

在JNDI查找时,可以利用上文说到的方法进行负载均衡;各厂商也会有自己专门的技术对stub的使用进行负载均衡,一般有以下三种方式:

Smart stub

我们知道,stub可以通过JNDI来获得和创建,甚至可以直接下载相应的class文件来在运行时动态生成,而无须在客户端本地的classpath中声明

图十七:smart stub



如图十七,Weblogic 和JBOSS通过在stub的代码中嵌入特殊的代码来实现集群,这个stub的确相当smart,它包含了所有能够访问的集群服务器节点、内置了专门的集群算法来决定把请求发给何处,甚至当集群的拓扑有变时(比如增加了节点),能动态改变自身来适应新的结构,无须手工干预
Smart stub有以下几个好处:

1.节省大量服务器资源
2.由于负载均衡是由客户端处理,因此可以防止在服务器端放置负载均衡器而可能导致的单点失败
3.Stub可以动态下载安装,意味着无须手工维护

IIOP Runtime Library

Sun JES采用另一种方法,它直接修改客户端的IIOP运行时库

图十八:IIOP Runtime


如图十八,sun直接把负载均衡逻辑转移到了IIOP库中,从而使stub能够保持“小而轻”,同时由于IIOP是底层库,能够更加有效地获取和使用JVM提供的资源。但正是由于底层库有所不同,使得JES与其他J2EE服务器打交道时可能会出现一些问题

Interceptor Proxy

IBM Websphere使用Location Service Daemon (LSD)作为一个拦截器代理来实现EJB集群

Figure 19: Interceptor Proxy

使用这种机制,stub中包含至LSD的路由信息,而不是直接去找服务器节点,这样LSD就能获得所有请求并进行负载均衡了,不过这样会大大增加管理和维护的成本

EJB的集群支持
调用EJB方法的过程中我们要和两个stub打交道,一个是home stub,另一个是object stub,因此可以在两个层面上实现负载均衡和失败恢复

1.EJBHOME STUB的集群实现
由于EJBHOME STUB本身不包括任何客户端信息,无论从哪个服务器上获得的EJBHOME STUB都是一样的,因此当客户端调用EJBHOME STUB的create等方法时,就能利用一些负载均衡的算法选择合适的服务器节点
2.EJBOBJECT STUB的集群实现

EJBOBJECT STUB包含业务接口,而且其本身也能够含有集群节点的信息,但也不是所有的方法调用都能够进行负载均衡式的路由,得看EJB的类型是什么
无状态会话bean最容易实现负载均衡了,因为它本身不包含特定的客户信息

有状态会话bean略有不同,因为它本身包含客户端的会话信息,因此有状态bean的集群实现本质上和HTTP session 无异,一般情况下客户端的stub都是一直与某个节点上的EJB组件打交道的,除非中途出问题了才会将请求转发到备用的节点上

实体bean本质上也是无状态的。表面上看可以采用和无状态会话bean一样的方式集群,但实际上很少厂商会对实体bean做集群。因为实体bean一般都是被其他会话bean调用的,因此通常都使用本地接口通讯,实在没有集群的必要

四.JMS和数据库连接的集群

目前一些数据库产品已经可以集群了,你可以部署成多份,每个节点之间可以同步。但是JDBC本质上是有状态连接,和底层的socket紧密绑定。当某个JDBC连接突然中断了,与之相关的对象也就费了,因此很难对JDBC集群。Weblogic使用一种JDBC multipool,可以在JDBC断开情况下,方便地进行重新连接

JMS的负载均衡和失败恢复只在JMS broker上有实现,很少有厂商在JMS destination 的消息上实现了负载均衡

五.关于J2EE集群的神话
失败恢复能够防止所有错误吗?——错!
JBOSS的文档花了整整一章的内容来提醒你:“你真的需要HTTP SESSION复制吗”,有时候不用失败恢复也能以经济的方式获得高可靠性。更何况,失败恢复并没有你想象中的那么可靠

你也许认为失败恢复能够在节点宕机时保护你的session数据,但你得清楚,这种保障是有代价的。

回想一下作者在定义“失败恢复”时,前提条件是“在两个方法调用之间”!也就是说只有在第一个方法成功返回之后、第二个方法调用开始之前,失败恢复才能起作用

假设某个方法处理到一半时服务器不幸挂掉了,客户端一般只能收到错误消息。除非你这个方法恰好是“idempotent”的(即多次调用的结果都能保持一致,不会对环境造成任何改变,比如getter方法),那么有些聪明的负载均衡器会尝试找其他节点去调用这个方法

所以说“idempotent”这个概念非常重要,因为客户端压根不知道是在什么地方失败的,而如果这个方法不是idempotent,那么系统就可能处于一种不一致的状态,很危险

你也许认为事务性的方法就是idempotent的,毕竟事务可以回滚。但其实事务远远不能涵盖整个远程调用的范围,比如服务器成功执行某事务性方法后,返回结果的过程中网络崩溃了呢?
在比较严格的系统设计中,你根本不能令所有方法都idempotent,你能做的就是利用failover,尽可能减少错误而不是彻底杜绝错误。以某个网上商城为例:每台服务器都同时处理100个用户请求,当某台服务器崩溃时,如果没有失败恢复,那么你会得罪一百个用户;而如果有失败恢复,可能只有不到20个用户会发飙。你自己要权衡:
        1.是得罪一百个客户还是得罪20个客户?
        2.有没有失败恢复的服务器的价格差别

独立的应用程序可以无缝地迁移到分布式平台上?——错!
这只是某些厂商的广告而已,不可轻信。如果是大型系统,那么设计之初就应该全盘考虑集群可能造成的影响.

HTTP  SESSION
正如前文所述,HTTP SESSION的集群会受到你使用的服务器的诸多限制。首先是可序列化的要求,在很多MVC架构中,session被用来存储一些不可序列化的对象(比如servlet context);其次,序列化、特别是数据库方式的序列化非常耗费资源,因此要集群就尽量不要用session存储大对象。如果是内存拷贝的方式,那么就要考虑内存的限制和交叉引用的问题(交叉引用请参考前文);最后,你在集群环境下改变session的属性时,必须使用“setAttribute”方法,而在单机环境下却没这个限制。这么做的主要原因是让你的应用服务器能够检测到属性改变,及时地备份已修改的属性

缓存
大部分流行的应用服务器都会使用缓存来提升性能,但缓存一般都是为单机环境设计的。集群环境下如果使用缓存,那么缓存之间的拷贝花费的性能将比缓存带来的好处还多,适得其反

静态变量
有一种很流行的J2EE设计模式“singleton(单体)”,是使用静态变量的,这在单机环境下适用,但到了集群就不行了,道理很简单,每个JVM都有自己的静态对象,“单体”也就失去意义了。比如要统计在线用户数时,经常用一个静态变量来存储,但是在集群环境下这种方法显然失去作用。要使用静态对象,最好把它放到一个数据库中,才能实现全局的“单体”

外部资源
尽管J2EE规范并不推荐,但外部IO操作还是有用的,比如用来存放用户上传的文件。在集群中,服务器是不能通过另一台服务器把本地文件直接存放到别的机器上的,那么还是要依靠数据库来统一存放文件,或者你可以使用SAN这种集中式文件仓库

专有服务
有些专有服务是只限于单机环境的,比如定时器服务(timer);再比如某些事件触发类型的服务,如初始化服务,邮件提醒服务也属于此列。这些服务一般针对一个特定条件只发生一次,拿去集群没什么意义。JBOSS的“clustered singleton facility”就是用来保证所有服务器运行且只运行一次某种服务

分布式系统比并列式系统更灵活?——未必

尽管EJB生来就是为了分布式、解耦合,但很多框架认为把EJB层和web层放在一起也未尝不是好事,或许更好

图20:分布式架构


如图20,负载均衡器先将请求分发到适当服务器的web层,web层进一步判断调用何处的EJB,这等于是做了两次的负载均衡和失败恢复。很多人认为这种设计并不好:
        1. 首先,第二次的转发根本没有必要,每个服务器都有自己的web和ejb层,比起只调用内部的ejb,web层调用其他ejb层没有任何的好处
        2. 第二次的失败恢复也是没有必要的,大部分厂商都把web容器和ejb容器实现为在同一个jvm上跑,那样一旦web容器挂了,ejb容器很难独善其身
        3. 损失性能,这个不必解释了,大量的服务器之间的调用对性能肯定有影响。

实际上,大部分厂商都让web容器优先选择同一个服务器上的ejb容器,这种方式称作“并列式”,是分布式的一种特例,如下图

图21:并列式



这样引出一个有趣的问题:既然都放一块了,为什么不直接用ejb的本地接口呢?虽然本地接口可以提高性能,但它却把web和ejb紧耦合在一起了,负载均衡机制也就没有办法对其进行优化,特别是当你要变成分布式的时候

此外很不幸的是,在集群环境下本地接口的使用经常受到限制,因为有本地接口的ejb通常是不可序列化的。所以有些应用服务器,比如sun JES,对本地接口的ejb做了特殊处理使其可以被序列化,从而保存到诸如session中去

还有一个问题是,既然大部分情况下并列式的性能都比较好,那还要分布式干什么呢?其实在某些情况下还非得用分布式不可:
        1. 除了web容器,富客户端也要调用ejb组件
        2. Web容器和ejb容器所处的安全级别不同,它们物流上也被放在不同的地方,中间加上一个防火墙
        3.Ejb和web层的极度不对称。指的是复杂度的不对称,比如ejb层有大规模的运算,那就放在一台高级的服务器上,而web容器只需放在一台pc上即可.

六.结论
集群与单机环境是有很大不同的,各厂商的集群实现也不同。最好在项目开始就考虑到集群,使得你的系统更有扩展性,根据自身的需求选择最合适的应用服务器,并且选购第三方软件时也要考虑到对集群的支持。最后,合适的架构可以让你受益于集群而不是让集群成为你的噩梦

分享到:
评论

相关推荐

    J2EE集群原理,负载均衡

    **J2EE集群原理** J2EE集群的基本思想是将单个服务器实例扩展到多个服务器实例,这些实例被称为节点。这些节点协同工作,提供服务,并且在系统出现故障时可以互相备份。集群的主要目标是实现负载均衡、高可用性和可...

    主要讲J2EE集群原理 ,很不错。

    J2EE集群原理详解 J2EE集群是一种技术,旨在提高应用程序的可用性和可伸缩性,通过将工作负载分散到多个服务器上实现负载均衡,并确保在单个服务器出现故障时,服务仍能正常运行,这称为失败接管。集群的核心概念...

    J2EE集群的学习

    - J2EE集群的基础概念和工作原理 - 集群配置和管理,包括网络设置、服务器同步和通信机制 - 负载均衡策略和工具的介绍 - 会话复制和粘滞会话的概念 - 容错机制和故障转移 - 性能优化和监控技巧 - 实战案例分析,展示...

    揭开J2EE集群的面纱

    总之,《揭开J2EE集群的面纱》是一本深入了解J2EE集群原理和技术细节的宝贵资源,无论是对于初学者还是经验丰富的开发者和架构师,都能从中获得深刻的启示和实用的指导。通过本书的学习,读者将能够更好地设计和优化...

    揭开J2EE集群的神秘面纱

    理解并掌握J2EE集群的原理和实践,对于开发和运维人员来说,是提升业务系统稳定性的必备技能。《揭开J2EE集群的神秘面纱》这本书将深入讲解这些概念,并提供实践经验,对学习和研究J2EE集群有着极大的帮助。

    J2EE集群技术揭秘

    在IT行业中,J2EE(Java 2 ...然而,实现和维护一个高效的J2EE集群也需要对J2EE规范、网络协议、分布式系统原理有深入理解,以及对各种中间件产品的熟练掌握。因此,不断学习和实践是成为J2EE集群技术专家的关键。

    揭开j2ee集群的神秘面纱

    总的来说,《揭开J2EE集群的神秘面纱》这篇文档将带领读者深入探讨J2EE集群的核心原理,帮助开发者和系统管理员更好地理解和运用这项技术,以构建稳定、高效的企业级应用环境。无论是初学者还是经验丰富的专业人士,...

    揭开J2EE集群的面纱 by 王昱.中英文双语

    首先,我们要理解J2EE集群的基本原理。在J2EE集群中,多个服务器实例(节点)协同工作,共享应用程序和用户会话数据。这样,当一个服务器出现故障时,其他服务器可以接管其工作,确保服务的连续性。此外,负载均衡...

    揭开J2EE集群的神秘面纱.pdf

    为了克服这些挑战,开发者和架构师需要深入理解J2EE集群的工作原理及其背后的机制。具体来说: - **会话管理**:对于Web应用而言,保持用户会话状态的一致性是至关重要的。这通常涉及到会话数据的复制或集中存储。 ...

    j2ee集群J2EEClustering.pdf

    然而,实现一个成功的J2EE集群并不是一件容易的事情,它需要系统架构师和开发人员对相关技术和原理有深入的理解,并在此基础上进行精心的设计和实施。此外,还需要充分考虑到集群环境的特性和限制,以及如何避免一些...

    J2EE扫盲之-揭开J2EE集群的神秘面纱

    本文旨在深入探讨J2EE集群这一重要概念及其背后的技术原理,帮助读者更好地理解如何利用集群技术来提升系统的可用性和扩展性。 #### 2. 基本术语 在正式讨论J2EE集群之前,有必要先了解一些与集群相关的基础概念:...

    揭开J2EE集群的面纱 中文版PDF

    ### 揭开J2EE集群的面纱 #### 前言 随着互联网技术的飞速发展,企业和组织越来越依赖于稳定可靠的应用程序来支撑其业务运作。在这样的背景下,J2EE(Java 2 Platform, Enterprise Edition)作为一套成熟的企业级...

    J2EE集群原理

    NULL 博文链接:https://showlike.iteye.com/blog/1474393

    J2EE_Clustering 王昱.pdf

    《J2EE集群技术揭秘》一文由Sun中国工程研究院的王昱撰写,深入探讨了J2EE集群技术的关键概念、实现原理以及常见误区。文章不仅涵盖了基础理论,还涉及了具体的实现策略和技术细节,为读者提供了全面而深入的理解。 ...

    Java平台企业版(J2EE) 原理

    J2EE还提供了其他服务,如安全性、事务管理、集群、资源适配器等,以支持大型企业的复杂需求。此外,J2EE遵循服务导向架构(SOA)原则,能够与其他系统通过Web服务进行互操作。 随着时间的推移,J2EE演变为Java EE,...

    Java平台企业版(J2EE)原理PPT课件.ppt

    Java平台企业版(Java Enterprise Edition,简称J2EE)是一种基于Java语言的多层应用程序开发框架,主要...3. 可扩展性:支持负载均衡和集群,能够处理大量并发请求。 4. 安全性:提供了安全机制,如SSL加密、角色基

    j2ee原理.PPT

    Java Java 平台企业版(J2EE)是企业级应用开发的重要框架,它为构建...3. 可伸缩性:J2EE 应用可以部署在集群环境中,实现负载均衡和故障恢复,确保系统的高可用性。 4. 安全性:J2EE 提供了多种安全机制,如角色基

Global site tag (gtag.js) - Google Analytics