如果强制同步后 NSX Edge 服务未按预期运行,您可以重新部署 NSX Edge 实例。

注: 重新部署是一种破坏性操作。首先应用强制同步,然后检查此问题是否已修复。最佳做法是下载 Edge 技术支持包,然后对问题进行故障排除。如果仍无法修复该问题,请重新部署。
重新部署 NSX Edge 实例将导致执行以下操作:
  • 删除 Edge 设备,并使用应用的最新配置进行全新部署。
  • 从控制器中删除逻辑路由器,然后使用应用的最新配置重新创建。
  • 删除主机上的分布式逻辑路由器实例,然后使用应用的最新配置重新创建。

如果未启用正常重新启动,将在重新部署期间撤消 OSPF 邻接。

采取以下良好做法有助于防止在重新部署 Edge 时丢失流量:
  • 当 OSPF 或 BGP 定时器值较大且在分布式逻辑路由器 (DLR) 和 Edge 服务网关 (ESG) 上都启用了高可用性 (HA) 时,启用平滑重启。
  • 当 HA 中的一个 DLR 与多个 ESG (ECMP) 对等互连时,使用较大的 OSPF 或 BGP 定时器值以及浮动静态路由。
重要事项: 在跨 vCenter NSX 环境中,您必须首先在主 NSX Manager 上重新部署 NSX Edge 实例。完成后,再在辅助 NSX Manager 上重新部署 NSX Edge 实例。需要对主 NSX Manager 和辅助 NSX Manager 上的 NSX Edge 实例都进行重新部署。

前提条件

  • 确认主机在重新部署操作期间具有足够的资源来部署额外的 NSX Edge 服务网关设备。有关每个 NSX Edge 大小所需的资源,请参见 NSX Data Center for vSphere 的系统要求
    • 对于单个 NSX Edge 实例,在重新部署期间具有两个处于“已打开电源”状态并具有相应大小的 NSX Edge 设备。
    • 对于启用了高可用性的 NSX Edge 实例,将在替换旧设备之前部署两个替换设备。这意味着,在升级给定的 NSX Edge 期间,将存在四个处于“已打开电源”状态并具有相应大小的 NSX Edge 设备。在重新部署 NSX Edge 实例后,任一 HA 设备均可能会变为活动状态。
  • 确认已为 NSX 准备在您重新部署的 NSX Edge 设备的配置位置和活动位置列出的主机群集,并且它们的消息基础架构状态为 GREEN

    确认已为 NSX 准备在所有 NSX Edge 设备的配置位置和活动位置列出的主机群集,并且它们的消息基础架构状态为 GREEN。 如果状态为绿色,则表明主机正在使用消息基础架构与 NSX Manager 通信,而不是使用 VIX。

    如果配置的位置不可用(例如,因为自 NSX Edge 设备创建后,群集已被移除),则仅确认活动位置。
    • 使用 GET https://NSX-Manager-IP-Address/api/4.0/edges/{edgeId}/appliances API 请求查找原始配置位置的 ID (configuredResourcePool > id) 和当前活动位置的 ID (resourcePoolId)。
    • 使用 GET https://NSX-Manager-IP-Address/api/2.0/nwfabric/status?resource={resourceId} API 请求查找这些群集的主机准备状态和消息基础架构状态,其中 resourceId 是前面找到的 NSX Edge 设备的配置位置和活动位置 ID。
      • 在响应正文中查找与 com.vmware.vshield.vsm.nwfabric.hostPrepfeatureId 对应的状态。该状态必须为 GREEN
        <nwFabricFeatureStatus>
          <featureId>com.vmware.vshield.vsm.nwfabric.hostPrep</featureId>
          <featureVersion>6.3.1.5124716</featureVersion>
          <updateAvailable>false</updateAvailable>
          <status>GREEN</status>
          <installed>true</installed>
          <enabled>true</enabled>
          <allowConfiguration>false</allowConfiguration>
        </nwFabricFeatureStatus>
      • 在响应正文中查找与 com.vmware.vshield.vsm.messagingInfrafeatureId 对应的状态。该状态必须为 GREEN
        <nwFabricFeatureStatus>
          <featureId>com.vmware.vshield.vsm.messagingInfra</featureId>
          <updateAvailable>false</updateAvailable
          <status>GREEN</status>
          <installed>true</installed>
          <enabled>true</enabled>
          <allowConfiguration>false</allowConfiguration>
        </nwFabricFeatureStatus>
    如果没有为 NSX 准备主机,请执行以下操作:
    • 导航到安装和升级 (Installation and Upgrade) > 主机准备 (Host Preparation),然后为 NSX 准备主机。
    • 确认消息基础架构的状态为绿色。
    • 在主机上重新部署 NSX Edge。

过程

  1. 登录到 vSphere Web Client
  2. 单击网络和安全 (Networking & Security) > NSX Edge (NSX Edges)
  3. 选择一个 NSX Edge 实例。
  4. 单击操作 (Actions) > 重新部署 (Redeploy)
    最佳做法是下载 Edge 技术支持包,然后对问题进行故障排除。如果问题仍然存在,请重新部署 Edge。

结果

NSX Edge 虚拟机会替换为新的虚拟机,所有的服务都将还原。如果重新部署不起作用,请关闭 NSX Edge 虚拟机的电源,然后再次重新部署 NSX Edge
注: 在以下情况中重新部署可能不起作用。
  • 安装有 NSX Edge 的资源池不再存在于 vCenter 清单中,或其受管对象 ID (Managed Object ID, MoId) 已更改。
  • 安装有 NSX Edge 的数据存储已损坏/已卸载或不可访问。
  • 连接 NSX Edge 接口的 dvportGroup 不再存在于 vCenter 清单中,或其 MoId(vCenter Server 中的标识符)已更改。
如果发生以上任一情况,您必须使用 REST API 调用来更新资源池、数据存储或 dvPortGroup 的 MoId。请参见 NSX API 指南

如果 NSX Edge 上已启用 FIPS 模式,并且出现了错误,则 NSX Manager 将不允许您重新部署 NSX Edge。您必须解决导致通信故障的基础架构问题,而不是重新部署 Edge。