在复制配置期间设置恢复点目标 (RPO) 值时,需要确定您可以忍受的数据丢失上限。

恢复点目标如何影响复制调度

RPO 值会影响复制调度,但 vSphere Replication 不遵守严格的复制调度。例如,将 RPO 设置为 15 分钟时,您指示 vSphere Replication 最多可以忍受的数据丢失时长为 15 分钟。这并不意味着数据每 15 分钟复制一次。

如果 RPO 设置为 x 分钟,且该 RPO 没有被违反,则最新的可用复制实例不会反映 x 分钟之前的状态。复制实例反映同步操作开始时虚拟机的状态。

将 RPO 设置为 15 分钟。如果同步操作开始于 12:00 并用 5 分钟时间传输到目标站点,则实例在 12:05 时在目标站点可用,但它只反映虚拟机在 12:00 时的状态。下一次同步开始时间将不迟于 12:10。当开始于 12:00 的第一个复制实例在 12:15 过期时,此复制实例将可用。

如果将 RPO 设置为 15 分钟并且复制传输一个实例用时 7.5 分钟,则 vSphere Replication 始终传输实例。如果复制用时超过 7.5 分钟,则复制会遇到周期性违反 RPO 的情况。

如果复制在 12:00 开始,传输实例需要 10 分钟,则复制将在 12:10 完成。您可以立即开始另一个复制,但该复制将在 12:20 完成。在时间间隔 12:15-12:20 期间,将发生 RPO 冲突,因为最新可用实例在 12:00 启动,所以太旧了。

复制调度程序会通过重叠复制以优化带宽使用来尝试符合这些约束,并且可能提前为某些虚拟机启动复制。

为确定复制传输时间,复制调度程序会使用前几个实例的持续时间来估计下一实例的传输时间。

初始完全同步后违反恢复点目标

虚拟机磁盘的初始完全同步过程非常耗时。该过程完成后,vSphere Replication 就立即开始复制在此期间更改的磁盘块(第一次增量同步),这可能需要比设置的 RPO 时间更长的传输时间。

第一次增量同步后,vSphere Replication 会检测到生成的副本实例失效,并开始报告违反 RPO。由于复制落后于 RPO 调度,因此第二次增量同步会在第一个增量同步完成后立即开始。

此即时后续增量同步过程将继续进行,直到 vSphere Replication 创建满足 RPO 调度的副本实例且不报告违反 RPO。复制状态变为“良好”。

5 分钟恢复点目标的工作原理

如果目标站点和源站点使用 VMFS 6.0、VMFS 5.x、NFS 4.1、NFS 3、vVol 或 vSAN 6.2 Update 3 以及更高版本的存储,则可以使用 5 分钟 RPO。

当目标站点和源站点使用 VMFS 6.0、VMFS 5.x、NFS 4.1、NFS 3、vVol 或 vSAN 6.2 Update 3 以及更高版本的存储时,vSphere Replication 会显示 5 分钟 RPO 设置。

如果在源站点和目标站点之间使用不同的数据存储类型,则可以使用 5 分钟 RPO 设置。

5 分钟的 RPO 要求源主机为 ESXi 6.5 或更高版本。

在 VMFS 6.0、VMFS 5.x、NFS 4.1、NFS 3 和 vSAN 6.2 Update 3 以及更高版本的存储上,最多可将 5 分钟 RPO 应用于 500 个虚拟机。在 vVol 数据存储上,最多可以应用于 50 个虚拟机。
注: 选择操作系统静默选项时,不支持小于 15 分钟的 RPO。

有关其他信息,请参见使用和配置 vSphere Replication 的最佳做法https://kb.vmware.com/s/article/2102463