NSX Edge 集群上,以活动-活动 (A-A) 有状态高可用性模式配置 Tier-0 和 Tier-1 网关,并启用有状态服务。

此过程考虑使用的拓扑在 A-A 有状态模式下使用 Tier-0 网关和 Tier-1 网关。

前提条件

  • 如果集群中的 NSX Edge 节点数量为奇数,则会导致出现某个子集群没有备份节点的场景。当这个节点发生故障时,流量将中断。NSX 会触发警报,您必须解决该警报才能正确配置有状态服务。确保 NSX Edge 集群包含的 NSX Edge 节点数量为偶数。例如,在由 4 个节点组成的 NSX Edge 集群中,NSX 构成两个子集群,其中每个子集群包含两个节点。每个子集群中有一个节点是活动 NSX Edge 节点的备份节点。
  • 确保将用作 NSX Edge 集群一部分的 NSX Edge 节点引用到不同的故障域。

过程

  1. 使用 admin 特权登录到 NSX Manager
  2. 转到网络 → Tier-0 网关
  3. 添加网关下拉菜单中,单击 Tier-0
  4. 输入 Tier-0 网关的名称。
  5. 在“HA 模式”字段中,选择活动-活动,然后启用 有状态
    注: 在将网关启用为有状态后,您将无法编辑 HA 模式。
  6. 选择 NSX Edge 集群,然后单击保存
  7. 单击以继续编辑 Tier-0 网关。
  8. 展开接口和接口组部分,然后在外部字段中单击设置
  9. 设置接口窗口中,单击添加接口
  10. 输入名称,选择将接口连接到的分段,然后选择 NSX Edge 节点。输入任何其他可选详细信息。
  11. 单击保存以完成添加接口。
  12. 添加接口后,转到接口组字段,然后单击设置
  13. 设置接口组窗口中,单击添加接口组
    重要说明: 创建一个由来自集群每个 Tier-0 SR 的一个上行链路组成的接口组。确保来自每个 SR 的一个上行链路属于该组,并且该上行链路仅属于一个组。加入接口组的每个接口都必须是等效接口。当上行链路可以在网络上访问并且共享同一防火墙、NAT 和其他网络 L4-L7 策略时,可将其称为等效链路。

    通过接口组,可将多个分段分组到一个连接到 NSX Edge 集群的组中。

    如果接口组没有来自每个 SR 的上行链路,则可能会导致流量丢失。 NSX 会在不满足此要求时触发警报。
  14. 单击关闭编辑以更新 Tier-0 A-A HA 网关。
  15. 部署 Tier-0 A-A 有状态网关后,在配置了 Tier-0 网关的同一 NSX Edge 集群上,以 A-A HA 模式部署 Tier-1 网关。横向扩展或收缩 Tier-0 网关(即添加新的 NSX Edge 子集群或移除子集群)时,关联的 Tier-1 网关也会遵循相同的行为。
  16. 在 Tier-0 网关上创建区域设置服务。
    PUT https://<policy-mgr>/policy/api/v1/infra/tier-0s/vmc_prv/locale-services/<locale_service>
    {
      "route_redistribution_types": [ "TIER0_STATIC", "TIER0_NAT" ],
      "edge_cluster_path": "/infra/sites/default/enforcement-point/nsx/edge-clusters/<95196903-6b8a-4276-a7c4-387263e834fd>",
      "preferred_edge_paths": [ "/infra/sites/default/enforcement-point/nsx/edge-clusters/<95196903-6b8a-4276-a7c4-387263e834fd>/edge-nodes/<940f1f4b-0317-45d4-84e2-b8c2394e7405>"],
      "_revision": 0
    }
  17. 在 A-A HA 模式下部署 Tier-1 网关,然后选择要运行该网关的 NSX Edge 集群。
  18. 在 Tier-1 上创建区域设置服务。

    如果不创建区域设置服务,网关则成为仅限 DR 的网关。

    PUT https://<policy-mgr>/policy/api/v1/infra/tier-1s/cgw/locale-services/<locale_service>
    {
      "edge_cluster_path": "/infra/sites/default/enforcement-point/nsx/edge-clusters/<95196903-6b8a-4276-a7c4-387263e834fd>",
      "preferred_edge_paths": [ "/infra/sites/default/enforcement-point/nsx/edge-clusters/<95196903-6b8a-4276-a7c4-387263e834fd>/edge-nodes/<940f1f4b-0317-45d4-84e2-b8c2394e7405>"],
      "_revision": 0
    }
  19. 在 Tier-0 A-A 有状态网关上为服务路由器创建 SNAT 规则。必须输入转换的 IP。
  20. 转到网络 → NAT,然后单击添加 NAT 规则
  21. 操作下拉列表中,选择 SNAT,然后输入源和目标 IP。
  22. 转换的 IP | 端口字段中,输入必须将源 IP 转换为的 IP。
  23. 单击保存 (Save)
  24. 验证 Tier-1 SR 和 Tier-0 SR 上的高可用性状态。确认子集群由一对 NSX Edge 节点组成。这两个节点均处于活动状态。对等体节点仅在活动节点发生故障时接管并处理流量。
    在 Tier-0 节点上> # get high-availability status
    Service Router
    UUID            : 073a9fda-7a11-4d59-80c3-a7ea5371d265
    state           : Active
    type            : TIER0
    mode            : Stateful A/A
    failover mode   : Preemptive
    rank            : 0
    service count   : 0
    service score   : 0
    HA ports state
        UUID        : de647a80-d27c-46ee-a251-b35a3cead0d0
        op_state    : Up
        addresses   : 169.254.0.2/25;fe80::50:56ff:fe56:5300/64
    Sub-cluster Information
        UUID            : c8db92e7-21da-453d-9853-2648849e7bda
        Peer SR UUID    : daaca25b-9028-4e31-b9b7-35bae481e60a
        Peer Node UUID  : 68668f1c-0330-11ec-84cf-00505682699c
    Peer Routers
        Node UUID   : 9fe732b6-0330-11ec-ae4e-005056821b5a
        HA state    : Active
        Node UUID   : 8486560a-0330-11ec-902b-00505682411d
        HA state    : Active
        Node UUID   : 68668f1c-0330-11ec-84cf-00505682699c
        HA state    : Active
    

结果

您可以在活动-活动模式下的 Tier-0 网关上运行有状态服务。

下一步做什么

  • 要横向扩展集群,请添加偶数数量的 NSX Edge 节点。
    注: 如果添加奇数数量的 NSX Edge 节点,则新添加的节点将没有备份节点。如果新添加的节点发生故障,流量将会中断。如果在 NSX Edge 集群中仅添加奇数数量的节点,则 NSX Manager 会发出警报。
  • 要横向缩减集群,请从集群中移除偶数数量的 NSX Edge 节点。