vRealize Operations Manager 支持高可用性 (High Availability, HA)。HA 为 vRealize Operations Manager 主节点创建副本,并且保护分析集群以防止节点丢失。
借助 HA,存储在主节点中的数据始终完全在副本节点上备份。要启用 HA,除主节点外还必须至少部署一个数据节点。如果您有多个数据节点,则可以在任何其他节点中存储和复制存储在主节点中的数据。但是,如果主节点发生故障,则只有副本节点可以取代主节点。
- HA 并非灾难恢复机制。HA 可保护分析集群,但仅针对一个节点丢失的情况,因为仅支持一个节点丢失,所以不能在所有 vSphere 集群内扩展节点以尝试隔离节点或构建故障区域。
- 启用 HA 后,如果主节点因任何原因而发生故障,则副本可以接管主节点提供的所有功能。如果主节点发生故障,则会自动执行故障切换到副本,并且仅需要两到三分钟的 vRealize Operations Manager 停机时间便可恢复操作并重新开始收集数据。
主节点问题导致故障切换时,副本节点成为主节点,并且集群在降级模式下运行。要退出降级模式,请执行以下步骤之一。
- 通过纠正主节点的问题返回 HA 模式。在主节点退出启用 HA 的集群后,如果没有人工干预,该主节点不会重新加入此集群。因此,在关闭的节点上重新启动 vRealize Operations Analytics 进程,将其角色更改为副本,并重新加入集群。
- 移除发生故障的主节点,然后通过将数据节点转换为副本来重新启用 HA。已移除的主节点无法修复,并且无法重新添加到 vRealize Operations Manager。
- 移除旧的发生故障的主节点,然后通过禁用 HA 更改为非 HA 操作。已移除的主节点无法修复,并且无法重新添加到 vRealize Operations Manager。
- 在管理界面中,HA 副本节点取代并成为新的主节点后,您无法从集群中移除先前脱机的主节点。此外,先前的节点仍显示为主节点。要刷新显示并移除节点,请刷新浏览器。
- 启用 HA 后,集群在一个数据节点丢失后仍可以处于活动状态,而不会丢失任何数据。但是,无论节点类型如何,HA 一次只能防止一个节点丢失的情况,因此不支持数据节点和主/副本节点或者两个或更多数据节点同时丢失的情况。相反,vRealize Operations Manager HA 提供额外的应用程序级别数据保护,以确保应用程序级别可用性。
- 启用 HA 后,vRealize Operations Manager 容量和处理能力将降低一半,因为 HA 会在整个集群内创建数据的冗余副本,并会创建主节点的副本备份。规划 vRealize Operations Manager 集群节点的数量和大小时请考虑您对 HA 的可能使用情况。请参见设置 vRealize Operations Manager 群集的大小。
- 启用 HA 后,在分隔的主机上部署分析集群节点,以实现冗余和隔离。一种选择是使用可将节点保持在 vSphere 集群内特定主机上的反关联规则。
如果无法保持节点分离,则不应启用 HA。主机故障可能会导致不止一个节点丢失,这种情况不受支持,因此 vRealize Operations Manager 可能会完全不可用。
反之亦然。如果没有 HA,您可以将节点保持在同一主机上,这样做并无差别。在没有 HA 的情况下,即使一个节点丢失也会使 vRealize Operations Manager 完全不可用。
- 当您关闭数据节点的电源并更改虚拟机的网络设置时,这会影响数据节点的 IP 地址。此后,HA 集群不再可访问,所有节点的状态均为“正在等待分析”。确认您使用了静态 IP 地址。
- 当您移除具有一个或多个 vCenter 适配器配置为从已启用 HA 的集群收集数据的节点时,与该节点关联的一个或多个 vCenter 适配器将停止收集。在移除节点之前,您可以更改适配器配置以将其固定到另一个节点。
- 管理用户界面仅显示为活动对象创建的资源缓存计数,但“清单”显示所有对象。因此,当从已启用 HA 的集群中移除节点时(允许 vCenter 适配器收集数据并重新均衡每个节点),“清单”会显示与管理用户界面中显示的内容不同的对象数量。