对于部署在高可用性拓扑中并且还使用 BGP 的站点,HA 故障切换可能会较慢,并导致客户流量中断,因为对等 Edge 在故障切换时删除了所有路由。在版本 5.1.0 及更高版本中,VMware 为 HA 部署添加了 BGP 平滑重启功能,以确保 HA 故障切换更快、破坏性更低。

概览

包含平滑切换BGP 平滑重启功能通过让相邻 BGP 设备参与重新启动来确保重新启动期间网络中不会发生路由更改,从而确保可更快完成 Edge 重新启动和 HA 故障切换。如果没有“BGP 平滑重启”功能,在 BGP 对等体之间的 TCP 会话终止后,对等 Edge 会删除所有路由,因此需要在 Edge 重新启动或 HA 故障切换后重新构建这些路由。“BGP 平滑重启”功能更改了此行为,因为当在可配置的重新启动定时器内建立新会话时,该功能可确保对等 Edge 保留路由。

注: “BGP 平滑重启”功能仅适用于在高可用性中部署的站点。此功能尚不适用于使用单个独立 Edge 部署的站点,即使它使用 BGP 路由协议也是如此。

必备条件

要使用“BGP 平滑重启”功能,客户站点必须满足以下条件。
  • 使用高可用性拓扑部署的站点。此站点可以是活动/备用站点,也可以是使用第三方路由器的 VRRP。BGP 平滑重启对独立 Edge 站点没有任何影响,它只会影响使用 HA 的站点。
  • 客户企业必须将 BGP 配置为路由协议。
重要说明: 为了充分优化 BGP 平滑重启的优势,强烈建议为客户企业激活 分布式成本计算 (DCC)。激活 DCC 后,首选项和通告决策将在 Edge 本地生效,而且在 Edge 从路由过程中学习路由后,即会将这些路由从活动设备同步到备用设备。DCC 的值不限于 HA 站点,有关此功能的详细信息,请参阅 VMware SD-WAN 路由概述配置分布式成本计算

配置 BGP 平滑重启

配置 BGP 平滑重启的过程分为两部分,第一部分在 BGP 配置部分中完成,第二部分在 高可用性配置部分中完成。步骤为:
  1. 配置 (Configure) > 设备 (Device) > BGP 中激活 BGP 平滑重启
    1. 在客户门户中,根据您的首选项,单击配置 (Configure) > 配置文件 (Profile) > 配置 (Configure) > Edge。屏幕截图将显示适用于单个 HA Edge 的步骤。
    2. 单击某个 Edge 旁边的设备 (Device) 图标,或者单击该 Edge 的链接,然后单击设备 (Device) 选项卡。
    3. 向下滚动到路由和 NAT (Routing & NAT) 部分,然后打开 Edge 或配置文件的 BGP 部分。

    4. BGP 部分中,选中平滑重启 (Graceful Restart) 复选框。

    5. 选中该框后,将显示两个与“启用平滑重启”(Enable Graceful Restart) 相关的其他参数:重启时间 (Restart Time)失效路径时间 (Stalepath Time)
      1. 重启时间 (Restart Time) 表示路由处理器 (Route Processor, RP) 在路由条目过期之前等待 RP 对等体开始通信的最长时间。此参数的默认时间是 120 秒,可以将其手动配置为 1 到 600 秒之间的值。
      2. 失效路径时间 (Stalepath Time) 表示路由在重新启动(HA 故障切换)后保留的最长时间。此时应已收到来自路由处理器对等体的更新路由。此参数的默认时间是 300 秒,可以将其手动配置为 1 到 3600 秒之间的值。
    6. 在用户激活 BGP 平滑重启并对两个辅助设置感到满意后,用户可以转到高可用性 (High Availability) 部分。
  2. 配置 (Configure) > 设备 (Device) > 高可用性 (High Availability)中激活平滑切换 (Graceful Switchover)
    1. BGP 部分中,向下滚动到高可用性 (High Availability) 部分。

    2. 高可用性 (High Availability) 部分中,由于激活了 BGP 平滑重启 (BGP Graceful Restart),因此现在可选中平滑切换 (Graceful Switchover) 对应的复选框。
    3. 选中平滑切换 (Graceful Switchover) 对应的复选框。
    4. 无需在高可用性 (High Availability) 部分中执行进一步操作,而且平滑切换 (Graceful Switchover) 也没有辅助参数。
  3. 向下滚动到配置 (Configure) > 设备 (Device) 页面的底部,然后单击右下角的保存更改 (Save Changes)。这将应用上面所做的配置更改。

限制/已知行为

  • BGP 平滑故障切换HA 平滑切换与分段无关,并且在一个分段(例如,全局分段)上激活这两个功能时,这些设置将应用于客户站点上的所有其他分段。这意味着 Edge 将在 HA 故障切换期间同步其他分段上的路由并保留失效的路由。