连续可用性 (CA) 将 vRealize Operations Manager 集群划分到两个故障域,并防止分析集群丢失故障域。

集群管理

集群由一个主节点、一个主副本节点、一个见证节点、一个数据节点和远程收集器节点组成。

vRealize Operations Manager 中启用连续可用性不是一种灾难恢复解决方案。

启用连续可用性后,信息将存储(复制)在集群内的两个不同分析节点中,但会在故障域之间延伸。由于大小调整要求,连续可用性要求系统的计算和容量要求翻倍。

如果主节点或主副本节点永久丢失,则必须替换丢失的节点,该节点将成为新的主副本节点。如果需要将新的主副本节点作为主节点,则可以使当前主节点脱机,然后等到主副本节点升级为新的主节点。然后将原主节点恢复联机,它将成为新的主副本节点。

故障域

故障域由分析节点组成,分为两个区域。

故障域由一个或多个分析节点组成,并根据其在数据中心内的物理位置进行分组。配置后,两个故障域使 vRealize Operations Manager 能够容忍整个物理位置的故障和专用于单个故障域的资源的故障。

见证节点

见证节点是集群的成员,但不是分析节点的一部分。

要在 vRealize Operations Manager 中启用 CA,请在集群中部署见证节点。见证节点不会收集数据,也不会存储数据。

当两个故障域之间的网络连接丢失时,如果必须针对 vRealize Operations Manager 的可用性做出决定,则见证节点可充当“决胜局”。

分析节点

分析节点由主节点、主副本节点和数据节点组成。

启用连续可用性后,您可以保护 vRealize Operations Manager 以免整个故障域丢失时数据丢失。如果节点对在故障域之间丢失,则可能会永久丢失数据。

将每个故障域中的分析节点部署到单独的主机,以减少主机发生故障时数据丢失的可能性。您可以使用 DRS 反关联性规则,以确保 vRealize Operations Manager 节点保留在不同的主机上。

远程收集器

vRealize Operations Manager 中,您可以创建收集器组。收集器组是一系列节点(分析节点和远程收集器)。您可以为收集器组分配适配器,而不是将一个适配器分配给单个节点。

启用连续可用性后,可以创建远程收集器组,以便从每个故障域内的适配器收集数据。

收集器组与故障域没有任何关联。收集器组的功能是收集数据并将其提供给分析节点,然后 vRealize Operations Manager 决定如何保留数据。

如果运行适配器收集的节点出现故障,则适配器将自动移动到收集器组中的另一个节点。

理论上,只要满足网络要求,便可在任何地方安装收集器。但是,从故障切换角度来看,不建议将所有收集器放在一个故障域中。如果所有收集器都定向到单个故障域,则在发生影响该故障域的网络中断时,vRealize Operations Manager 会停止接收数据。

建议将远程收集器保留在故障域外部,或者在故障域 1 中保留一半的远程收集器,在故障域 2 中保留其余远程收集器。

将所有正常适配器分配给收集器组,而不是分配给各个节点。混合适配器需要在适配器和受监控端点之间具有双向通信。

有关适配器的更多信息,请参见 适配器和管理包注意事项