SD-WAN Orchestrator 灾难恢复 (Disaster Recovery, DR) 功能防止在发生系统或网络故障时丢失存储的数据并恢复 SD-WAN Orchestrator 服务。

SD-WAN Orchestrator DR 涉及为数据复制设置活动/备用 SD-WAN Orchestrator 对以及手动触发的故障切换机制。
  • 因此,恢复时间目标 (Recovery Time Objective, RTO) 取决于操作员为触发备用服务器升级而明确执行的操作。
  • 不过,恢复点目标 (Recovery Point Objective, RPO) 实际上为零(与恢复时间无关),因为所有配置都是即时复制的。在中断期间收集的监控数据将缓存在等待升级备用服务器的 Edge 和网关上。
注: DR 是强制性的。有关许可和定价,请与 VMware 销售团队联系以获得支持。

活动/备用对

SD-WAN Orchestrator DR 部署中,将两个相同的 SD-WAN Orchestrator 系统配置为活动/备用对。操作员可以通过 Web UI 查看任一服务器上的 DR 就绪状态。Edge 和网关识别两个 SD-WAN Orchestrator,在它们仅从活动 SD-WAN Orchestrator 收到配置更改时,它们定期向两个系统发送 DR 检测信号以报告两个服务器的视图并查询 DR 系统状态。在操作员触发故障切换时,将在下一个 DR 检测信号中向 Edge 和网关通知该更改。

DR 状态

从操作员以及 Edge 和网关的视图中,SD-WAN Orchestrator 具有以下四种 DR 状态之一:

DR 状态 描述
独立 未配置任何 DR。
活动 已配置 DR,充当主 SD-WAN Orchestrator 服务器。
备用 已配置 DR,充当非活动副本 SD-WAN Orchestrator 服务器。
僵停 以前配置了 DR 并处于活动状态,但不再充当活动或备用服务器。

运行时操作

如果配置了 DR,备用服务器以受限模式运行,从而阻止与 DR 状态和 DR 检测信号相关的 API 调用以外的所有调用。在操作员调用故障切换时,将升级备用服务器以作为独立服务器完全正常运行。如果以前处于活动状态的服务器能够响应,并且可以从升级的备用服务器中看到该服务器,以前的活动服务器将自动转变为僵停状态。在僵停状态下,将阻止管理配置服务,并将尚未转变为新的活动 SD-WAN Orchestrator 的 Edge 和网关中的任何联系人重定向到升级的服务器。

disaster-recovery-replica-and-status