vRealize Operations Manager支持高可用性 (High Availability, HA)。HA 为 vRealize Operations Manager主节点创建副本,并且保护分析群集以防止节点丢失。

借助 HA,存储在主节点上的数据始终完全在副本节点上备份。要启用 HA,除主节点外还必须至少部署一个数据节点。

  • HA 并非灾难恢复机制。HA 可保护分析群集,但仅针对一个节点丢失的情况,因为仅支持一个节点丢失,所以不能在所有 vSphere群集内扩展节点以尝试隔离节点或构建故障区域。

  • 启用 HA 后,如果主节点因任何原因而发生故障,则副本可以接管主节点提供的所有功能。如果主节点发生故障,则会自动将故障切换到副本,并且仅需要两到三分钟的 vRealize Operations Manager停机时间便可恢复操作并重新开始收集数据。

    主节点问题导致故障切换时,副本节点成为主节点,并且群集在降级模式下运行。要退出降级模式,请执行以下步骤之一。

    • 通过纠正主节点的问题返回 HA 模式。在主节点退出启用 HA 的群集后,如果没有人工干预,该主节点不会重新加入此群集。因此,在关闭的节点上重新启动 vRealize Operations Analytics 进程,将其角色更改为副本,并重新加入群集。

    • 将某个数据节点转化为新的副本节点,然后移除旧的故障主节点,从而返回到 HA 模式。已移除的主节点无法修复,并且无法重新添加到 vRealize Operations Manager

    • 禁用 HA,然后移除旧的故障主节点,从而更改为非 HA 操作。已移除的主节点无法修复,并且无法重新添加到 vRealize Operations Manager

  • 在管理界面中,HA 副本节点取代并成为新的主节点后,您无法从群集中移除先前脱机的主节点。此外,先前的节点继续显示为主节点。要刷新显示并移除节点,请刷新浏览器。

  • 启用 HA 后,群集在一个数据节点丢失后仍可以处于活动状态,而不会丢失任何数据。但是,无论节点类型如何,HA 一次只能防止一个节点丢失的情况,因此不支持数据节点和主/副本节点或者两个或更多数据节点同时丢失的情况。相反,vRealize Operations ManagerHA 提供额外的应用程序级别数据保护,以确保应用程序级别可用性。

  • 启用 HA 后,vRealize Operations Manager容量和处理能力将降低一半,因为 HA 创建整个群集内数据的冗余副本以及主节点的副本备份。规划vRealize Operations Manager群集节点的数量和大小时请考虑您对 HA 的可能使用情况。请参见设置 vRealize Operations Manager 群集的大小

  • 启用 HA 后,在分隔的主机上部署分析群集节点,以实现冗余和隔离。一种选择是使用可将节点保持在 vSphere群集内特定主机上的反关联规则。

    如果无法保持节点分离,则不应启用 HA。主机故障会导致不止一个节点丢失,这种情况不受支持,因此 vRealize Operations Manager将完全不可用。

    反之亦然。如果没有 HA,您可以将节点保持在同一主机上,这样做并无差别。在没有 HA 的情况下,即使一个节点丢失也会使 vRealize Operations Manager完全不可用。

  • 当您关闭数据节点的电源并更改虚拟机的网络设置时,这会影响数据节点的 IP 地址。此后,HA 群集不再可访问,所有节点的状态均为“正在等待分析”。确认您使用了静态 IP 地址。

  • 当您移除具有一个或多个 vCenter 适配器配置为从已启用 HA 的群集收集数据的节点时,与该节点关联的一个或多个 vCenter 适配器将停止收集。在移除节点之前,您可以更改适配器配置以将其固定到另一个节点。

  • 管理 UI 显示仅为活动对象创建的资源缓存计数,但清单资源管理器显示所有对象。因此,当从已启用 HA 的群集中移除节点时(允许 vCenter 适配器收集数据并重新平衡每个节点),清单资源管理器会显示与管理 UI 中显示的内容不同的对象数量。