对于部署在高可用性拓扑中并且还使用 BGP 的站点,HA 故障切换可能会较慢,并导致客户流量中断,因为对等 Edge 在故障切换时删除了所有路由。在版本 5.1.0 及更高版本中,VMware 为 HA 部署添加了 BGP 平滑重启功能,以确保 HA 故障切换更快、破坏性更低。
概览
包含平滑切换的 BGP 平滑重启功能通过让相邻 BGP 设备参与重新启动来确保重新启动期间网络中不会发生路由更改,从而确保可更快完成 Edge 重新启动和 HA 故障切换。如果没有“BGP 平滑重启”功能,在 BGP 对等体之间的 TCP 会话终止后,对等 Edge 会删除所有路由,因此需要在 Edge 重新启动或 HA 故障切换后重新构建这些路由。“BGP 平滑重启”功能更改了此行为,因为当在可配置的重新启动定时器内建立新会话时,该功能可确保对等 Edge 保留路由。
注: “BGP 平滑重启”功能仅适用于在高可用性中部署的站点。此功能尚不适用于使用单个独立 Edge 部署的站点,即使它使用 BGP 路由协议也是如此。
必备条件
要使用“BGP 平滑重启”功能,客户站点必须满足以下条件。
- 使用高可用性拓扑部署的站点。此站点可以是活动/备用站点,也可以是使用第三方路由器的 VRRP。BGP 平滑重启对独立 Edge 站点没有任何影响,它只会影响使用 HA 的站点。
- 客户企业必须将 BGP 配置为路由协议。
重要说明: 为了充分优化
BGP 平滑重启的优势,强烈建议为客户企业激活
分布式成本计算 (DCC)。激活 DCC 后,首选项和通告决策将在 Edge 本地生效,而且在 Edge 从路由过程中学习路由后,即会将这些路由从活动设备同步到备用设备。DCC 的值不限于 HA 站点,有关此功能的详细信息,请参阅
VMware SD-WAN 路由概述和
配置分布式成本计算。
配置 BGP 平滑重启
配置
BGP 平滑重启的过程分为两部分,第一部分在
BGP 配置部分中完成,第二部分在
高可用性配置部分中完成。步骤为:
- 在BGP 平滑重启。
- 在客户门户中,根据您的首选项,单击 。屏幕截图将显示适用于单个 HA Edge 的步骤。
- 单击某个 Edge 旁边的设备 (Device) 图标,或者单击该 Edge 的链接,然后单击设备 (Device) 选项卡。
- 向下滚动到路由和 NAT (Routing & NAT) 部分,然后打开 Edge 或配置文件的 BGP 部分。
- 在 BGP 部分中,选中平滑重启 (Graceful Restart) 复选框。
- 选中该框后,将显示两个与“启用平滑重启”(Enable Graceful Restart) 相关的其他参数:重启时间 (Restart Time) 和失效路径时间 (Stalepath Time):
- 重启时间 (Restart Time) 表示路由处理器 (Route Processor, RP) 在路由条目过期之前等待 RP 对等体开始通信的最长时间。此参数的默认时间是 120 秒,可以将其手动配置为 1 到 600 秒之间的值。
- 失效路径时间 (Stalepath Time) 表示路由在重新启动(HA 故障切换)后保留的最长时间。此时应已收到来自路由处理器对等体的更新路由。此参数的默认时间是 300 秒,可以将其手动配置为 1 到 3600 秒之间的值。
- 在用户激活 BGP 平滑重启并对两个辅助设置感到满意后,用户可以转到高可用性 (High Availability) 部分。
中激活 - 在平滑切换 (Graceful Switchover)。
- 在 BGP 部分中,向下滚动到高可用性 (High Availability) 部分。
- 在高可用性 (High Availability) 部分中,由于激活了 BGP 平滑重启 (BGP Graceful Restart),因此现在可选中平滑切换 (Graceful Switchover) 对应的复选框。
- 选中平滑切换 (Graceful Switchover) 对应的复选框。
- 无需在高可用性 (High Availability) 部分中执行进一步操作,而且平滑切换 (Graceful Switchover) 也没有辅助参数。
中激活 - 向下滚动到保存更改 (Save Changes)。这将应用上面所做的配置更改。 页面的底部,然后单击右下角的
限制/已知行为
- BGP 平滑故障切换和 HA 平滑切换与分段无关,并且在一个分段(例如,全局分段)上激活这两个功能时,这些设置将应用于客户站点上的所有其他分段。这意味着 Edge 将在 HA 故障切换期间同步其他分段上的路由并保留失效的路由。