SD-WAN Orchestrator 灾难恢复概述

SD-WAN Orchestrator 灾难恢复 (Disaster Recovery, DR) 功能防止在发生系统或网络故障时丢失存储的数据并恢复 SD-WAN Orchestrator 服务。

SD-WAN Orchestrator DR 涉及为数据复制设置活动/备用 SD-WAN Orchestrator 对以及手动触发的故障切换机制。

因此，恢复时间目标 (Recovery Time Objective, RTO) 取决于操作员为触发备用服务器升级而明确执行的操作。
不过，恢复点目标 (Recovery Point Objective, RPO) 实际上为零（与恢复时间无关），因为所有配置都是即时复制的。在中断期间收集的监控数据将缓存在等待升级备用服务器的 Edge 和网关上。

注： DR 是强制性的。有关许可和定价，请与 VMware 销售团队联系以获得支持。

活动/备用对

在 SD-WAN Orchestrator DR 部署中，将两个相同的 SD-WAN Orchestrator 系统配置为活动/备用对。操作员可以通过 Web UI 查看任一服务器上的 DR 就绪状态。Edge 和网关识别两个 SD-WAN Orchestrator，在它们仅从活动 SD-WAN Orchestrator 收到配置更改时，它们定期向两个系统发送 DR 检测信号以报告两个服务器的视图并查询 DR 系统状态。在操作员触发故障切换时，将在下一个 DR 检测信号中向 Edge 和网关通知该更改。

DR 状态

从操作员以及 Edge 和网关的视图中，SD-WAN Orchestrator 具有以下四种 DR 状态之一：


DR 状态	描述
独立	未配置任何 DR。
活动	已配置 DR，充当主 SD-WAN Orchestrator 服务器。
备用	已配置 DR，充当非活动副本 SD-WAN Orchestrator 服务器。
僵停	以前配置了 DR 并处于活动状态，但不再充当活动或备用服务器。

运行时操作

如果配置了 DR，备用服务器以受限模式运行，从而阻止与 DR 状态和 DR 检测信号相关的 API 调用以外的所有调用。在操作员调用故障切换时，将升级备用服务器以作为独立服务器完全正常运行。如果以前处于活动状态的服务器能够响应，并且可以从升级的备用服务器中看到该服务器，以前的活动服务器将自动转变为僵停状态。在僵停状态下，将阻止管理配置服务，并将尚未转变为新的活动 SD-WAN Orchestrator 的 Edge 和网关中的任何联系人重定向到升级的服务器。

disaster-recovery-replica-and-status