vRealize Operations 支持连续可用性 (CA)。CA 将 vRealize Operations 集群分为两个故障域,并跨 vSphere 集群延伸,以保护分析集群免受整个故障域的损失。
您可以为分析集群配置连续可用性。这样便可以跨两个故障域延伸集群节点。故障域由一个或多个分析节点组成,并根据其在数据中心内的物理位置进行分组。通过 CA,两个故障域能让 vRealize Operations 容忍整个物理位置的故障和专用于单个故障域的资源故障。
要在 vRealize Operations 中激活连续可用性,必须在集群中部署见证节点。vRealize Operations 集群只能有一个见证节点。见证节点不会收集数据,也不会存储数据。如果两个故障域的网络连接丢失,集群将陷入脑裂情况。见证节点检测到这种情况后,其中一个故障域将进入脱机状态,以避免出现数据不一致问题。您将在见证节点使其脱机的节点的管理 UI 上看到恢复联机按钮。在使用此选项使故障域恢复联机之前,请确保两个故障域中节点之间的网络连接已恢复且稳定。确认后,您可以使故障域恢复联机。
通过 CA,存储在分组到故障域 1 的主节点和数据节点中的数据始终完全同步到故障域 2 中配对的副本节点和数据节点。要激活 CA,除主节点外还必须至少部署一个数据节点。如果您有多个数据节点,则必须有偶数个数据节点(包括主节点)。例如,根据适当的大小调整要求,集群必须具有 2、4、6、8、10、12、14 或 16 个节点。存储在故障域 1 的主节点中的数据将存储在故障域 2 的副本节点中并进行复制。存储在故障域 1 的数据节点中的数据将存储在故障域 2 的配对数据节点中并进行复制。但是,如果主节点发生故障,则只有副本节点可以取代主节点。
- CA 可防止分析集群丢失特定于一个故障域的一半分析节点。您可以跨 vSphere 集群延伸节点,以尝试隔离节点或构建故障区域。
- 激活 CA 后,副本节点可以接管主节点提供的所有功能,以防主节点发生故障。故障切换到副本节点的操作是自动执行的,并且仅需要两到三分钟的 vRealize Operations 停机时间,便可恢复操作并重新开始收集数据。
注: 如果主节点发生故障,副本节点将成为主节点,并且集群在降级模式下运行。要解决此问题,请执行以下操作之一。
- 手动纠正主节点故障。
- 通过取代主节点返回到 CA 模式。替换节点不会修复节点故障,而新节点将承担主节点角色。
- 在管理界面中,CA 副本节点取代并成为新的主节点后,您无法从集群中移除先前脱机的主节点。此外,先前的节点仍显示为主节点。要刷新显示并移除节点,请刷新浏览器。
- 激活 CA 后,集群在一个故障域中丢失一半数据节点时仍可以处于活动状态,而不会丢失任何数据。CA 一次只能防止一个故障域丢失的情况。不支持两个故障域中的数据节点和主/副本节点或者两个或多个数据节点同时丢失的情况。
- 如果在其中一个故障域关闭时关闭主节点或主节点副本的电源,则激活了 CA 的集群将无法正常运行。
- 激活 CA 后,vRealize Operations 容量和处理能力将降低一半,因为 CA 会在整个集群内创建数据的冗余副本,并会创建主节点的副本备份。规划 vRealize Operations 集群节点的数量和大小时请考虑您对 CA 的可能使用情况。请参见设置 vRealize Operations 集群的大小。
- 激活 CA 后,在分隔的主机上部署每个故障域中的分析集群节点,以实现冗余和隔离。您还可以使用反关联规则将节点保持在 vSphere 集群内的特定主机上。
- 如果无法使每个故障域中的节点分开,您仍可以激活 CA。主机故障可能会导致故障域中的数据节点丢失,并且 vRealize Operations 仍可在其他故障域中使用。
- 如果无法将数据节点拆分到不同的 vSphere 集群中,请不要激活 CA。集群故障可能会导致丢失一半以上的数据节点,这种情况不受支持,因此所有 vSphere 都可能变得不可用。
- 如果没有 CA,您可以将同一主机上的节点保留在同一 vSphere 中。在没有 CA 的情况下,即使一个节点丢失也会使 vRealize Operations 完全不可用。
- 当您关闭两个故障域中的数据节点的电源并更改虚拟机的网络设置时,会影响数据节点的 IP 地址。此后,将无法再访问 CA 集群,并且所有节点状态都将更改为
"Waiting for analytics"
。确认您使用了静态 IP 地址。 - 当您移除具有一个或多个 vCenter 适配器配置为从已激活 CA 的集群收集数据的节点时,与该节点关联的一个或多个 vCenter 适配器将停止收集。在移除节点之前,您必须更改适配器配置以将其固定到另一个节点。
- 管理界面仅显示为活动对象创建的资源缓存计数,但清单将显示所有对象。当从已激活 CA 的集群中移除节点时(允许 vCenter 适配器收集数据并重新均衡每个节点),清单中显示的对象数量会与管理用户界面中显示的不同。