- 浏览: 117995 次
- 性别:
- 来自: 北京
文章分类
最新评论
HACMP全攻略之概念篇——一些容易混淆或常被问及的问题、基本概念、什么情况下不要用HA
一直想把自己对HACMP认识写下来,一直却难得动笔。
不管写得如何,今天开始吧!
一些容易混淆或常被问及的问题:
- hacmp不是错误避免,只能减少宕机时间,不可能避免。
- 不是有了HA就OK的,它需要包括各种软硬件、仔细的设计规划及管理等,ha软件只是其中一部分。
- hacmp是通过减少单点故障来减少宕机时间的。
- hacmp的plan非常重要,要仔细考虑。
- hacmp既可以减少计划外的宕机时间,也可以减少计划内的宕机时间。90%的宕机时间是计划内的,减少计划内的宕机时间只能靠管理员不断提高自己的水平来解决了。
- hacmp是无法解决所有问题的,ha解决不了诸如硬盘、硬盘适配器、硬盘总线的损坏,当然也解决不了ha自身的问题。这些问题应该在操作系统层面上解决。
- 可以通过自定义的事件来实现大多数个性化的需求。
- hacmp心跳信号用的是snmp协议,同时在TCP/IP和非TCP/IP网络上跑,非TCP/IP包括RS232/RS422、SSA、SCSI等。所以心跳线不只是使用串口线。
- 没有配非TCP/IP网络的,即没有心跳线的HA是可以跑的。前面已经说了心跳信号在TCP/IP网络上也在跑。但是,没有非TCP/IP网络的HA是无法区分TCP/IP失败还是节点失败,这样的话网络的失败会造成孤立的节点,备用会对资源进行错误的接管。
- hacmp es最多可支持128个节点,但实际很少会见到超过3个节点的Cluster。
- 任何时候都不要kill ha进程。
- 即使用了ha,备份依旧是不可缺少的。
基本概念
- 拓扑:一个逻辑概念,包括节点、网络、网卡以及之间的关系。
- 资源:ip地址、文件系统、卷组、应用等。
- 资源组:一组资源,包含在接管中所要用的所有资源。一个节点可以有多个资源组。
- 应用服务器:启动/停止应用的脚本。
- 同步:在所有节点中更新配置,ha 4.x拓扑和资源是分开同步的,5以后就只要同步一次就可以了。
- 事件:状态的改变。可以通过自定义事件来实现个性化的要求。
- 进程:核心进程包括clstrmgr和clsmuxpd。此外还有,clinfo-提供显示群集的状态,cllockd-提供并发控制,在concurrent模式下使用。
- cascading模式,有优先级,按优先级来接管资源。优先级高的节点恢复后将回拉资源。
- rotating模式,节点是平等的,按预先定义的顺序接管资源,节点恢复后不会回拉资源。
- concurrent模式,并发模式,应用跑在所有的的节点上,不存在资源接管的问题。
什么情况下不要用HA
- 如果不能忍受任何宕机时间。7*24小时的服务或生命系统的服务需要使用错误避免。
- 如果你的系统安全和网络安全得不到保障的话,使用HA也是没有意义的。
- 如果没有经过培训的系统管理员,或常有用户在上面瞎搞得话,还是不用为好。
HACMP全攻略之准备篇 |
HACMP全攻略之准备篇 首先当然是要安装操作系统了。AIX的安装这儿就不讲了,记着打补丁、升微码,应该没什么问题吧。 |
HACMP全攻略之安装与配置 |
HACMP全攻略之安装与配置
在此之前我们已经设计好了cluster、定义了TCP/IP网络、串口网络、LVM。下面就要开始安装HA软件包了。 |
HACMP全攻略之安装与配置2 |
HACMP全攻略之安装与配置 2-资源组的配置
下面开始定义资源
首先增加一个资源组:
Define Resource Groups
Move cursor to desired item and press Enter.
Add a Resource Group Change / Show a Resource Group Remove a Resource Group Change / Show Resource Group Processing Order
Add a Resource Group
Type or select values in entry fields. Press Enter AFTER making all desired changes.
[Entry Fields] * Resource Group Name [test_app] * Node Relationship cascading + * Site Relationship ignore + * Participating Node Names / Default Node Priority [servera serverb] +
在这确定接管方式和顺序。 下面增加Application Servers Define Application Servers
Move cursor to desired item and press Enter.
Add an Application Server Change / Show an Application Server Remove an Application Server
Add an Application Server
Type or select values in entry fields. Press Enter AFTER making all desired changes.
[Entry Fields] * Server Name [test_s ] * Start Script [] * Stop Script []
脚本要写绝对路径。 然后设置资源组属性: Change/Show Resources/Attributes for a Resource Group
Type or select values in entry fields. Press Enter AFTER making all desired changes.
[Entry Fields] Resource Group Name test_app Node Relationship cascading Site Relationship ignore Participating Node Names / Default Node Priority servera serverb Dynamic Node Priority [] +
Service IP label [servera_svc] + Filesystems (default is All) [] + Filesystems Consistency Check fsck + Filesystems Recovery Method sequential + Filesystems/Directories to Export [] + Filesystems/Directories to NFS mount [] + Network For NFS Mount [] + Volume Groups [servera_vg] + Concurrent Volume groups [] + Raw Disk PVIDs [] + Connections Services [] + Fast Connect Services [] + Tape Resources [] + Application Servers [test_s] + Communication Links [] + Primary Workload Manager Class [] + Secondary Workload Manager Class [] + Miscellaneous Data []
Automatically Import Volume Groups false + Inactive Takeover Activated false + Cascading Without Fallback Enabled false + Disk Fencing Activated false + Filesystems mounted before IP configured false +
配置好了就开始同步:
Synchronize Cluster Resources
Type or select values in entry fields. Press Enter AFTER making all desired changes.
[Entry Fields] Ignore Cluster Verification Errors? [No] + Un/Configure Cluster Resources? [Yes] + * Emulate or Actual? [Actual] + * Skip Cluster Verification [No] +
Note: Only the local node's default configuration files keep the changes you make for resource DARE emulation. Once you run your emulation, to restore the original configuration rather than running an actual DARE, run the SMIT command, "Restore System Default Configuration from Active Configuration." We recommend that you make a snapshot before running an emulation, just in case uncontrolled cluster events happen during emulation. 一切ok的话,ha的配置过程就算结束了。 仔细想想也没什么难的,对吧。 上面的环境是ha4.5,ha5就更加简单了。主要的步骤都差不多,只是菜单变化比较大,熟悉一下就应该可以了。当然5的功能还是强了许多,特别在同步上,感觉方便多了。
如果想进一步,还有很多事可以做,比如利用各种事件来监控系统和应用啦。 以后再说吧,写东西还是蛮累得。 |
发表评论
-
人人网中间层的设置
2012-02-03 15:34 1254看到一个关于人人架 ... -
高并发高负载网站的系统架构浅析
2012-01-18 18:22 3180大型网站,比如门户 ... -
架构设计之分布式缓存
2012-01-16 18:29 16481:前言 我们在开发系统的过程中,缓存是个有用的模块。 ... -
从 iBatis 到 MyBatis
2011-10-25 11:31 1065对于从事 Java EE 的开发人员来说,iBat ... -
高并发高流量网站架构设计
2011-09-25 21:53 1100今天看到一片相关的文章,觉得不错,以供分享。尽管讲的不是很透彻 ... -
Hibernate性能优化要点
2011-09-22 19:04 905Hibernate性能优化要点: 1.尽量使用man ... -
数据权限管理方案探讨
2011-09-22 11:56 1812Ralasafe开源有段时间了,大约有2个月了。根据社区的 ... -
Hibernate过滤器使用窍门
2011-09-22 11:16 1107Hibernate3新增了对某个类或者集合使用预先定义的Hib ... -
软件架构师应该知道的97件事
2011-09-13 20:05 675软件架构师是IT 行业里 ...
相关推荐
AIX HACMP很值得推荐一看的HACMP配置
- **Application Server**:在HACMP之上运行的应用程序,可以通过脚本控制启动和停止。 - **Resource**:可移动至集群中另一个节点的逻辑组件,如文件系统、裸设备和服务IP,具有高可用性。 - **Resource Group**:...
【HACMP的基本概念】 HACMP的核心功能在于消除单点故障,它能够检测并处理系统硬件失效,保持资源的正常运行。这种灵活性允许用户在不同规模和性能等级的服务器之间构建集群,支持多种网络适配器和磁盘子系统的集成...
### HACMP状态查看(AIX 5.3 HACMP 5.4.1) #### 知识点一:环境配置 在进行HACMP(High Availability Cluster Multiprocessing)状态查看之前,首先需要确保环境已经正确配置好。具体操作包括: 1. **环境变量设置...
下面是HACMP的基本概念和配置过程: 一、HACMP的基本概念 HACMP是一种高可用性集群技术,能够在多个服务器之间提供高可用性和负载均衡的服务。该技术可以应用于各种企业应用,例如数据库、文件服务器、Web服务器等...
- **理解 HACMP 概念**:深入了解 HACMP 的工作原理、架构以及它如何实现高可用性。 - **规划 HACMP 集群**:学习如何根据实际需求和环境来规划 HACMP 集群的配置。 - **部署 HACMP 环境**:掌握部署 HACMP 集群的...
HACMP 日常维护操作 HACMP(High Availability Cluster Multiprocessing)是一种高可用性集群解决方案,主要用于提供高可用性和高容错性的服务。下面将详细介绍 HACMP 日常维护操作的相关知识点。 一、HACMP 双机...
【标题】"AIX HACMP 图片详解(1)" 涉及的主要知识点是IBM AIX操作系统上的高可用性集群多处理器(High Availability Cluster Multiprocessing,简称HACMP)的基本概念、架构以及初步的配置步骤。这部分内容通常会...
AIX 7.1小型机用HACMP软件是IBM为提供高可用性集群解决方案而设计的一款关键组件,尤其适用于那些需要确保业务连续性的企业。HACMP,全称为High Availability Cluster Multi-Processing,现在更名为powerHA ...
IBM AIX HACMP(High Availability Cluster Multiprocessing)是IBM为AIX操作系统提供的一种高可用性解决方案,旨在确保关键业务应用在系统故障时能够迅速恢复,从而提高系统的整体可用性和稳定性。AIX HACMP通过...
### IBM HACMP安装步骤详解 #### 一、前言 IBM High Availability Cluster Multiprocessing (HACMP) 是一种用于AIX操作系统的集群管理软件,主要用于实现高可用性(HA)和服务连续性。通过HACMP,可以在多台服务器...
打补丁是确保HACMP稳定运行的关键步骤之一。许多已知的问题和缺陷已在补丁中得到修复。因此,在完成软件安装和配置之后,应立即给HACMP打上最新的补丁。 - **获取补丁**: 可以从IBM官方网站下载所需补丁,也可以...
### HACMP (High Availability Cluster Multi-Processing) 安装与管理详解 #### 概述 HACMP,即High Availability Cluster Multi-Processing,是IBM为AIX操作系统设计的一种高可用性集群解决方案。HACMP旨在通过在...
接下来将详细介绍HACMP的基本概念、软件构成、工具、定制过程以及处理错误的方式。 ### HACMP 基本概念 #### Cluster (集群) - **定义**: 连接到一个公共IP网络的2-16台运行HACMP的RS/6000主机的集合。 - **作用**...