故障域是 NSX Edge 集群中 NSX Edge 节点的逻辑分组。故障域遵循自动放置算法,可在发生影响多个 NSX Edge 节点的故障时保证服务可用性。
在故障域中,Tier-1 SR 的活动和备用实例或子集群成员始终在不同的故障域中运行。如果没有故障域,可能会将 Tier-1 SR 自动放置在位于同一机架中的 NSX Edge 节点上。因此,如果 Rack1 发生故障,此 Tier-1 SR 的活动和备用实例也会失败。
未配置故障域:
- 在包含四个 Edge 节点(EdgeNode1、EdgeNode2、EdgeNode3、EdgeNode4)的 Edge 集群中,任何处于 A/S 模式的新 Tier-1 网关都将自动放置在这四个 Edge 节点的任何两个节点中。
- 但是,如果 Tier-1 A/S 部署在 Rack1 中,而 Tier-2 A/S 部署在 Rack2 中,则无法实现高可用性。如果 Rack1 发生故障,EdgeNode1 和 EdgeNode2 上的 Tier-1 A/S 将丢失,因为它们位于同一故障域中。
配置了故障域:
- EdgeNode1 和 EdgeNode2 配置为故障域 1 的一部分,而 EdgeNode3 和 EdgeNode4 位于故障域 2 中。创建新的 Tier-1 SR 时,如果该 Tier-1 的活动实例托管在 EdgeNode1 上,则将在故障域 2(EdgeNode3 或 EdgeNode4)中实例化备用 Tier-1 SR。
- 在 Edge 集群上配置故障域后,任何新 Tier-1 活动/备用 SR 将正确放置在不同的故障域中。