今天跟同事聊了一会关于HA的事,本文总结一下
数据库HA
一般把数据库层面的HA,和应用层面HA分开考虑
数据库一般采用数据库产品提供的HA方案,比如Oracle的RAC,mysql的集群,mongodb的replica set等
无HA的运维
在应用层面不做HA,我们产品有试过,后果十分惨重。无论是应用down了,还是硬件故障,都会造成业务中断。而且这时候想定位问题就十分纠结,因为保留现场去定位问题比较理想,但是业务一直不恢复客户又有意见,所以不做HA在生产环境是强烈不推荐的
如果真的没有HA,那运维也就是人工观察,发现业务中断了,就赶快把应用再启起来。好一点的话,可以做一点自动拉起引用的脚本,实现自动化。但是因为硬件始终只有一台,所以有时候没有办法启起来,只能临时迁移,业务中断时间会很长。而且只有一套环境,会发生应用一起来马上又down掉
冷备
基本上就是准备两套硬件,一套跑业务,另一套备用。第一套坏了,就把备用的那套启起来。这样基本可以抗硬件故障,因为2套硬件同时坏的几率比较低。也可以把2套硬件放在不同的网段,这样还可以抗网络故障
不过也有几个问题:
1、成本高,硬件成本,以及相应的机柜场租、电费也跟着上去了
2、第二套启动需要时间,所以业务还是会中断一会,如果是对可用性要求很严格的服务,冷备的方案基本无法满足
一般会搭配一些HA管理软件,业界比较有名的是VERITAS,可以自动改IP,自动启应用等,不过也比较贵
N:1备份
也是冷备的一种,不过比硬件double的方案能省一些成本。前提是应用是分布式的,那么可以只准备一台额外的机器,把所有分布式组件都部署上,然后哪个组件坏了就启哪个。如果同时2个组件坏了,那就没办法了。启动过程中的业务中断也是无法避免的。总的来说,可靠性不如完全的冷备方案,不过能省点成本
热备负载均衡
这种方案是可用性最高的方案,同时启动2套应用,在上层加一个负载均衡。如果一套坏了,就把请求发到好的那一台,再尝试恢复坏的那一套。业务是不中断的,但是只剩一套应用的那段时间,压力会突然大很多
前提是应用需要是无状态的,否则坏了那台机的请求,也没法转发到别的机器上。基本上应用只要满足这个条件,都会选择热备,选择冷备一般是无奈的选择(无状态改造短期做不到),因为消耗的硬件是一样的,热备的效果明显要更好
分享到:
相关推荐
总结来说,Rose HA双机热备方案通过其先进的监控、快速的故障切换和资源共享机制,为关键业务提供高可用性和稳定性保障。企业可以根据自身需求选择合适的Rose HA版本,确保服务的连续性和可靠性。同时,定期更新和...
总结来说,Proxmox VE 是一种强大的开源虚拟化管理平台,它提供了高度灵活、高可用和低成本的解决方案。通过其去中心化和超融合的设计,Proxmox VE 实现了虚拟机迁移和高可用性,使得企业在构建私有云时能够享受到...
在本文中,我们将深入探讨一个基于HA(High Availability,高可用性)的Web服务器双机热备部署方案。 首先,双机热备是指在两台服务器之间建立的一种冗余配置,以确保当主服务器发生故障时,另一台服务器能够无缝...
HA-PartitionMagic80-LDR1,作为一款在Windows环境下运行的中文磁盘分区工具,以其用户友好的界面和强大的功能,为用户提供了一种简单易用的解决方案,使得磁盘管理变得轻而易举。 首先,我们来了解什么是磁盘分区...
Rose HA(High Availability)双机热备系统是一种在Windows环境下实现高可用性的解决方案,它通过将关键服务或应用程序配置在两台或多台服务器上,以确保在一台服务器出现故障时,服务能够迅速无缝地切换到另一台...
### 集群中几种session同步解决方案的比较 在分布式系统和集群环境中,session管理是一项关键技术,它确保了用户在不同服务器之间的交互能够保持一致性。本文将深入探讨六种常用的session共享方法,包括它们的工作...
总结起来,HA_4UWMAMP3Converter_v592是一款功能全面、操作简便的音频转换工具,它以采样率转换为核心,兼顾多格式支持和易用性,为用户提供了高效、便捷的音频处理方案。无论你是音频爱好者,还是需要在网页或博客...
在选择适合的高可用解决方案时,需要考虑以下几个方面。首先是SLA需求,这直接关系到业务目标的实现。其次是操作能力,即是否有足够的资源来实施和维护高可用性方案。服务敏捷性是另一个关键因素,随着企业的发展,...
总结来说,NFS-HA的切换流程涉及到了多个层面的技术操作,包括网络地址和文件系统的重新映射,文件锁的迁移和释放,以及客户端的迁移处理。这些操作在文档中通过一系列的步骤进行了详细的描述,并且涉及到了一些特别...
采用PostgreSQL的HA方案,可以确保即使在主服务器发生故障的情况下也能快速恢复服务,减少业务中断时间。 - **大数据分析**:在数据分析场景下,PostgreSQL可以与其他大数据技术栈结合使用,如Apache Spark等,实现...
Hive是一种基于Hadoop的数据仓库工具,它能够将结构化的数据文件映射为数据库表,并通过提供类似SQL的查询语言来实现对这些数据的查询操作。这使得不熟悉MapReduce的用户也能方便地进行数据查询。 #### 安装与配置 ...
总结,VMware虚拟化方案为湖北国税提供了有效解决当前困境的途径,通过服务器整合和资源优化,实现了机房空间、电力和运维成本的高效利用,同时提升了系统可靠性,为未来的信息化建设打下了坚实的基础。
文档中还提到了几种用于构建高可用性集群的文件系统和技术: - **OCFS2**:Oracle Cluster File System 2,是Oracle为集群环境设计的文件系统。 - **MSCS**:Microsoft Cluster Service,是微软提供的集群服务,...
总结来说,面对Java IBM WebSphere的内存溢出问题,我们需要结合`javacore`和`deapdump`等诊断工具,通过分析脚本和相关库文件,理解内存管理原理,调整JVM配置,并优化代码,才能有效地排查和解决问题。
在发生故障切换后,经常遇到的问题就是同步报错,数据库很小的时候,dump完再导入很简单就处理好了,但线上的数据库都150G-200G,如果用单纯的这种方法,成本太高,故经过一段时间的摸索,总结了几种处理方法。...
HA NameNode是一种高可用性解决方案,旨在解决NameNode单点故障的问题。在一个典型的HA集群中,每个NameNode是一台独立的服务器。在任一时刻,只有一个NameNode处于active状态,另一个NameNode处于standby状态。HA ...
总结来说,SUSE HA 是一种强大的高可用性解决方案,通过精心的安装和配置,可以为关键服务提供高可用性和容错能力。安装过程中需严格按照步骤操作,并确保在配置阶段充分考虑集群的稳定性和冗余性。最后,务必注意 ...
为了实现高可用性(HA),可以采用以下几种方案: - **MMM方式**:这是一种简单的主-主复制模式,但在实现多数据中心容灾方面有限制。 - **Heartbeat+DRBD方式**:提供了一种更复杂的解决方案,可以在不同数据中心...
自动部署方案通常包括以下几个步骤: 1. **前期准备**:首先,需要准备一个包含所有必需软件包和配置脚本的网络存储位置,例如NFS或HTTP服务器。这些软件包应包括AIX操作系统镜像、IVM固件、系统管理中间件(如...
- **故障分类:** 可分为以下几种类型: - **ESXi主机故障:** 当ESXi主机发生故障时,HA系统将尝试重启受影响的虚拟机。 - **网络隔离:** 如果主机与网络隔离,但与数据存储的连接仍然正常,此时HA系统也会触发故障...