在 NSX 联合环境中,如果为每个分段使用延伸的覆盖网络分段,则会在 NSX Edge 节点上运行一个活动 SR 和一个备用 SR。

活动 NSX Edge 节点出现故障时,NSX 控制平面可确保流量故障切换到备用 NSX Edge 节点,并将所有传输节点流量分别转发到新的活动 NSX Edge 节点。

来看这个拓扑:您在 NSX 联合环境中跨多个站点创建了 L2 延伸覆盖网络分段,其中每个分段均依赖于两个采用活动/备用配置的 NSX Edge 节点来传输跨站点流量。例如,如图 1 中所示,NSX Edge 1 为活动节点,NSX Edge 2 为备用节点。相应地,活动 NSX Edge 的 VTEP 将作为活动 L2 转发器,用于来自所有 ESXi 传输节点的所有跨站点流量。

为确保 NSX Edge 节点的 HA 功能,每个 NSX Edge 节点都会将 HA 状态传达给中央控制平面,以便其知道谁是活动 NSX Edge。控制平面又会将从 NSX Edge 节点收到的 VTEP 组成员资格和 HA 状态信息传达给托管这些延伸分段的所有传输节点。

输出将显示这两个 NSX Edge 节点的 HA 状态。失效记录为 False,表示 HA 状态准确。

要查看故障切换后活动 Edge VTEP 的 HA 状态,请遵循以下过程:

注: 此过程适用于在联合环境中使用的所有 NSX 延伸分段。

前提条件

过程

  1. 复制已连接到 Tier-1 或 Tier-0 网关的延伸分段的 UUID。
  2. 定义哪个是分段所连接的特定 T1 网关的活动 Edge。
  3. 还可以使用以下 API 获取特定分段的活动/备用 Edge。
    /infra/segments/<segment-id>/inter-site-forwarder/site-span-info
  4. 使用 admin 用户密码连接到 Edge。
  5. 运行 get vtep-group 以了解 NSX Edge 节点上的 VTEP 组。
  6. 验证 get vtep-group 命令的输出是否包含延伸分段 UUID。
  7. 复制与该分段对应的 VTEP-Group ID。
  8. 在 NSX Manager 节点的 CLI 终端中,运行 get vtep-group <vtep-group-ID> vteps-staleness-status
    VNI       IP                   MAC            LABEL       Segment      TransportNode-Id                      TN-Connection   HA-STATE  STALE-RECORD
    
    26625     172.20.1.151     00:0c:29:9e:64:5e      0x18001    172.20.1.0   32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE     False
    26625     172.20.1.152     00:0c:29:ea:8e:aa      0xFC01     172.20.1.0   914d0362-32bc-11ee-ba27-000c29ea8ea0        true        STANDBY     False
    

  9. 运行 get vtep-group 以了解 NSX Edge 节点上的 VTEP 组。
  10. 验证 get vtep-group 命令的输出是否包含延伸分段 UUID。
  11. 复制与该分段对应的 VTEP-Group ID
  12. 在 NSX Manager 节点的 CLI 终端中,运行 get vtep-group <vtep-group-ID> vteps-staleness-status
    VNI           IP                   MAC            LABEL       Segment      TransportNode-Id                      TN-Connection   HA-STATE  STALE-RECORD
    26625     172.20.1.151     00:0c:29:9e:64:5e      0x18001    172.20.1.0   32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE     False
    26625     172.20.1.152     00:0c:29:ea:8e:aa      0xFC01     172.20.1.0   914d0362-32bc-11ee-ba27-000c29ea8ea0        true        STANDBY     False
    输出将显示这两个 NSX Edge 节点的 HA 状态。失效记录为 False,表示 HA 状态准确。
  13. 确认其中一个 NSX Edge 节点处于活动状态并且另一个节点处于备用模式。
  14. 如果活动 NSX Edge 关闭,HA 状态模式将发生变化。备用节点将成为活动节点。
  15. 运行 get vtep-group <vtep-group-ID> vteps-staleness-status
     VNI        IP                  MAC              LABEL       Segment        TransportNode-Id                     TN-Connection   HA-STATE  STALE-RECORD
     26625   172.20.1.151    00:0c:29:9e:64:5e       0x18001    172.20.1.0    32330174-32bc-11ee-8063-000c299e6454        true         ACTIVE      True
     26625   172.20.1.152    00:0c:29:ea:8e:aa       0xFC01     172.20.1.0    914d0362-32bc-11ee-ba27-000c29ea8ea0        true         ACTIVE     False

    在输出中,地址为 172.20.1.151NSX Edge 已关闭,因此 Stale-RecordTrue

结果

NSX 控制平面可确保在 VTEP 组的输出中正确记录了 NSX Edge 故障节点的失效条目。