服务器群集:Windows Server 2003 备份和恢复的最佳做法:
发布日期: 2005年03月14日
本页内容
客户具有系统的备份
可能有两种 Microsoft Windows Server 2003 的备份:“权威性系统恢复”(ASR) 备份包括群集配置(我们称之为“系统状态备份”),以及完全的本地备份(我们称之为“本地备份”)。请注意,要执行“权威性恢复”,要求提供“系统状态备份”。如果您在一个节点上执行“权威性恢复”,Microsoft 建议您在其他群集节点上执行“非权威性恢复”。
群集节点无法启动
在这种情况下,我们假定仲裁磁盘功能正常,且所有数据未受到破坏。
使用“非权威性恢复”。这应当与“系统状态备份”或“本地备份”结合使用。
这将会恢复故障节点上的群集数据库,然后受影响节点将可以重新加入群集。在这种情况下,它将会从群集中的其他节点下载群集数据库的最新副本。
在一个节点上使用“非权威性恢复”。假定仲裁磁盘完好,该节点应当能够利用仲裁磁盘的状态形成群集。如果上述方法无效,则可以尝试对该节点进行“权威性恢复”(这需要“系统状态备份”)。
所有节点都完好,但仲裁磁盘无法正常工作
群集节点可以启动,但是在所有节点上都无法启动群集服务,因为它无法使仲裁资源返回联机状态。事件日志中会有一个条目指出无法使仲裁返回联机状态。
如果驱动器本身也失败,则替换仲裁磁盘;如果物理驱动器没有失败,则重新格式化仲裁磁盘。使用“权威性恢复”(如果您有的话)来启动一个节点。
使用 fixquorum 标记来启动群集服务(请注意 fixquorum 允许您启动因为仲裁资源被破坏而无法联机的群集服务,但它并不能真正为您修复任何数据),然后选择一个替代仲裁资源(如果您没有其他磁盘的话,可以使用本地仲裁)。通过设置新仲裁,可以在仲裁上创建新的仲裁日志文件,但注册表检查点文件并没有恢复,因为旧的仲裁已不可用。
Reskit 工具 ClusterRecovery 可以帮助解决这个问题。
请按照“检查点文件已丢失或损坏”一节中介绍的过程来解决检查点文件的问题。
其中一个群集节点上的群集数据库损坏
您会发现,如果节点没有加入群集或是群集日志(默认情况下为 %windir%\cluster\cluster.log)中的条目指向损坏的单元,则会出现这种情况。
对此节点进行一次“非权威性恢复”,然后使其加入群集。
从仲裁磁盘上复制最新的检查点文件 (chkXXX.tmp),并覆盖受影响节点上的 %windir%\cluster\clusdb 文件,然后重新启动该服务。
在某个工作群集节点上停止该服务。使用 RegEdit 卸载群集单元。
从工作节点上将 %windir%\cluster\clusdb 文件复制到受影响节点上的 %windir%\cluster\clusdb,然后重新启动所有节点上的群集服务。
所有节点都运行良好,但仲裁数据库损坏
在这种情况下,没有节点可以形成群集,事件日志中的条目会指出一个仲裁损坏的日志。
使用 resetquorumlogfile 开关启动群集服务。如果所有资源都成功启动,并且配置看来也没有问题,那么就不需要再执行什么操作。通过设置新仲裁,可以在仲裁磁盘上创建新的仲裁日志文件,但注册表检查点文件并没有恢复,因为旧的仲裁已不可用。
请按照“检查点文件丢失或损坏”一节中介绍的过程来解决检查点文件的问题。
如果这个方法失败,请对一个节点进行“权威性恢复”,然后重新启动群集服务以形成群集。对所有其他节点使用“非权威性恢复”。
检查点文件丢失或损坏
如果由于注册表检查点文件损坏而找不到或不能加载该文件,则资源处于联机状态时在注册表中可能不具有最新信息。但是这种影响取决于资源,在一些情况下,资源可能无法返回联机状态。在其他情况下,所作的配置更改可能会丢失。如果检查点文件丢失,群集服务并不会在事件日志中添加一个事件,因此如果您怀疑存在这个问题的话,就需要查看群集日志。
如果资源无法返回联机状态,请使用资源工具包工具 ClusterRecovery 重新创建资源检查点。
注意:您应当仅恢复无法返回联机状态的资源的检查点文件。
如果这个方法无法解决问题,请对一个群集节点使用“权威性恢复”,然后重新启动群集服务以形成群集。对所有其他节点使用“非权威性恢复”。
一个群集磁盘损坏或无法正常工作
依赖于此磁盘的资源可能无法返回联机状态。该磁盘无法返回联机状态或磁盘上的数据被损坏。有两种情况,一种是需要替换磁盘,一种是不需要。
替换磁盘,并对一个节点使用“非权威性恢复”。将数据恢复到磁盘。
使用包含 ClusterRecovery 工具的资源工具包,这个工具允许使用一个新磁盘替换现有的物理磁盘资源,而不用进行系统状态恢复。一旦物理磁盘返回联机状态之后,您就可以恢复任何数据。
客户没有系统的备份
在这种情况下,我们建议采用解决一些灾难问题的过程,而不使用备份。很明显地,这个解决方案对于所有情况来说并不完整。
一个或多个群集节点的单一系统损坏
在这种情况下,我们假定仲裁磁盘功能正常,且所有数据未受到破坏。
所有节点都完好,但 Quorum 磁盘无法正常工作
使用 fixquorum 标记来启动群集服务(请注意 fixquorum 允许您启动因为仲裁资源被破坏而无法在线的群集服务,但它并不能真正为您修复任何数据),然后选择一个替代仲裁资源(如果您没有其他磁盘的话,可以使用本地仲裁)。通过设置新仲裁,可以在仲裁上创建新的仲裁日志文件,但注册表检查点文件并没有恢复,因为旧的仲裁已不可用。
Reskit 工具 ClusterRecovery 可以帮助解决这个问题。
请按照“检查点文件已丢失或损坏”一节中介绍的过程来解决检查点的问题。
其中一个群集节点上的群集数据库已损坏
从仲裁磁盘上复制最新的检查点文件 (chkXXX.tmp),并覆盖受影响节点上的 %windir%\cluster\clusdb 文件,然后重新启动该服务。
在另一个节点上停止该服务。使用 RegEdit 卸载该群集单元。
从群集中的一个正在运行的节点上将 %windir%\cluster\clusdb 文件复制到受影响节点上的 %windir%\cluster\clusdb,然后重新启动所有节点上的群集服务。
所有节点都运行良好,但仲裁数据库损坏
使用 resetquorumlogfile 开关启动群集服务。如果所有资源都成功启动,并且配置看来也没有问题,那么就不需要再执行什么操作。通过设置新仲裁,可以在仲裁磁盘上创建新的仲裁日志文件,但注册表检查点文件并没有恢复,因为旧的仲裁已不可用。
请按照“检查点文件丢失或损坏”一节中介绍的过程来解决检查点文件的问题。
检查点文件丢失或损坏
如果由于注册表检查点文件损坏而找不到或不能加载该文件,则资源处于在线状态时在注册表中可能不具有最新信息。但是这种影响取决于资源,在一些情况下,资源可能无法返回在线状态。在其他情况下,所作的配置更改可能会丢失。如果检查点文件丢失,群集服务并不会在事件日志中添加一个事件,因此如果您怀疑存在这个问题的话,就需要查看群集日志。
如果资源无法返回在线状态,请使用资源工具包工具 ClusterRecovery 重新创建资源检查点。
注意:您应当仅恢复无法返回在线状态的资源的检查点文件。
一个群集磁盘损坏或无法正常工作
如果磁盘已被强行卸下,可能需要运行 chkdsk 以便使该磁盘返回联机状态。当磁盘返回联机状态时,群集服务会自动运行 chkdsk。在 Windows Server 2003 中,一条 chkdsk 日志记录会被保留,以便您可以了解磁盘处于什么状态以及发现了什么问题。如果磁盘上的应用程序数据已被损坏或删除,而您又没有备份,那么就无法恢复数据。您必须重新生成数据或是重新构建应用程序。服务器群集不会向用户提供数据保护和冗余,您应当使用冗余硬件(镜像磁盘或 RAID 磁盘),并经常备份数据。
群集备份的最佳做法建议
我们建议您在对群集进行重大配置更改的前后进行一次备份。必须执行以下所有步骤。
1. |
使用一个 ASR 备份定期备份每个节点的系统状态,必须在节点上运行群集服务,以便正确记录群集磁盘的磁盘信息。
这实际上是备份节点的系统状态数据。您目前尚不能备份所有共享磁盘上的数据,只能备份本地承载的磁盘上的数据。
要执行恢复操作,备份文件必须可以从本地获取或者使用 PXE 启动获取。可以通过网络进行 ASR。如果在 ASR 期间进行磁盘维护,则需要重新启动计算机,然后重新启动 ASR 过程。重新启动的消息并不会警告您必须重新启动 ASR 操作。备份支持在 ASR 期间加载非原装驱动程序 (in-the-box driver),但仅限于 HCL 中的驱动程序/设备。
|
2. |
请单独备份节点承载的所有群集磁盘(只能备份所有的磁盘)。
将所有群集磁盘备份保存到网络共享中可方便进行管理。这些备份不应是整个备份。如果附加到现有备份后面会导致备份损坏,则通过单独保存每个节点的备份就可以降低丢失全部内容的风险。应将系统状态和系统磁盘包含在这些备份中,这样才可以完整备份使用备份基础结构的 WINS、DHCP 以及其他服务。系统状态/系统磁盘/仲裁设备的备份集可以使用,但 ASR 软盘可能需要人工进行更新才能够使用这些备份集,或者必须执行 ASR,然后才可以从群集磁盘备份集中恢复系统状态/系统磁盘。
|
3. |
|
分享到:
相关推荐
在IT领域,Windows Server 2003是微软推出的一款企业级操作系统,广泛应用于服务器环境,特别是对于需要高可用性和负载均衡的企业应用来说,它的群集功能尤其关键。本指南将详细阐述如何创建和配置Win2003服务器群集...
文档《双机热备份集群配置备忘录.doc》和《Windows Server 2003服务器群集创建和配置指南.doc》提供了详细的步骤和最佳实践,帮助管理员正确实施群集和双机热备份配置。《使用说明.htm》可能包含操作指引和常见问题...
1. **Windows Server 2003群集**:Windows Server 2003提供了群集服务,允许多台服务器共享同一个名称和IP地址,以提供高可用性。群集可以防止单点故障,当一台服务器出现故障时,另一台可以接管工作负载。配置包括...
- 操作系统:Windows Server 2003 SP2 - 补丁:安装SP1补丁及必要的设备驱动 #### 三、存储配置 1. **DS3400 配置步骤** - **确认连接**:确保所有硬件之间的连接正确无误。 - **安装Storage Manager**:在...
知识点:Windows Server 2012 R2 的备份和恢复。 3. 查看计算机的IP 地址可以使用命令 Ipconfig 。 知识点:Windows Server 2012 R2 的网络管理。 4. 关于 NTFS 文件系统中的权限继承,子文件夹会继承上级文件夹...
在IT领域,Windows Server 2003 MSCS(Microsoft Cluster Service)与SQL Server 2005的群集部署是一项关键的技术实践,用于构建高可用性和灾难恢复解决方案。这项技术涉及多个层面,包括操作系统配置、集群服务设置...
11. **应用程序服务器**:Windows Server 2003也可作为运行各种企业级应用程序的平台,如IIS(Internet Information Services)用于Web服务,SQL Server用于数据库服务等。 通过以上对Windows Server 2003管理的...
在Windows Server 2003的企业版和数据中心版中,支持的群集规模有了显著的提升,从2节点和4节点增加到了8节点群集,大大扩展了服务器群集的应用场景和扩展性。 64位支持是另一项改进,在新的群集服务中,Windows ...
《Windows Server 2003服务器实训指导书》是一本专为学习和实践Windows Server 2003操作系统设计的教程。此书旨在帮助读者掌握该操作系统在企业环境中的核心功能和服务,提升IT专业人员在服务器管理、网络配置、安全...
传统的SQL Server群集方案通常采用1+1的方式,即每一个SQL Server服务都有一个主节点和一个备份节点;而N+1的SQL Server群集则允许多个SQL Server服务共享同一个备份节点。 - **目的**: - **降低成本**: 通过减少...
总之,构建基于Windows Server 2003的MSSQL 2008故障转移群集是一个复杂的过程,涉及到多个步骤和组件,包括域控服务器的设置、网络配置、账户管理和群集创建。通过这样的设置,可以为关键的数据库应用提供高可用性...
### Exchange Server备份与恢复精讲 #### Exchange Server备份与恢复概览 Exchange Server作为企业级邮件服务器,承载着大量的电子邮件通信任务,其数据的安全性和完整性至关重要。因此,掌握Exchange Server的...
涵盖了群集、数据库复制、备份和恢复策略,确保在硬件故障或灾难情况下,邮件服务能够快速恢复。 **附录**: 附录中提供了详细的参考信息,包括最佳实践、技术规格和资源链接,以帮助读者进一步理解和应用Exchange ...
3. **故障转移群集**:Exchange Server 2003支持群集功能,可以在多台服务器之间实现故障转移。当主服务器出现问题时,群集可以自动将服务转移到另一台健康的服务器上,确保服务的连续性。 4. **Exchange System ...
此外,还会涉及磁盘管理,包括分区、格式化、动态磁盘、卷的创建和管理,以及数据备份和恢复的方法。 网络服务的设置和管理也是重要一环。这包括TCP/IP协议的配置,如静态IP地址、子网掩码、默认网关设置,以及DNS...
5. **磁盘管理**:提供了动态磁盘和存储卷管理,方便数据备份和恢复。 6. **安全增强**:包括改进的身份验证机制、防火墙配置和更新的加密技术,确保数据安全。 四、部署与管理 Windows Server 2003在部署和管理...