您可以使用 vSphere Replication 编译的报告优化复制环境、确定环境中的问题并发现最可能的原因。

服务器和站点连接、违反 RPO 的次数以及其他衡量指标都会为作为管理员的您提供诊断复制问题所需的信息。

以下各节包含解释监控下方 vSphere Replication 选项卡中的报告下显示的数据的示例。

违反 RPO

在源和目标站点上,环境中的各种问题可能会导致大量违反 RPO 的情况。通过历史复制作业的更多详细信息,您可以就如何管理复制环境做出明智的决策。

表 1. 分析违反 RPO 的情况

可能的原因

解决方案

  • 网络带宽不能容纳所有复制。

  • 复制流量可能已增加。

  • 大型虚拟机的初始完全同步花费的时间超过为虚拟机配置的 RPO。

  • 在某些更改速率较高的虚拟机上禁用复制以允许较低更改速率的虚拟机满足其 RPO 目标。

  • 增加所选主机的网络带宽。

  • 检查复制流量是否已增加。如果流量已增加,则调查可能的原因,例如,可能在未向您发送通知的情况下已更改应用程序的使用情况。

  • 检查平均已传输字节数的历史数据是否存在显著的持续增长。如果存在增长,请联系应用程序所有者确定可能与此增长相关的最新事件。

  • 调整为不太激进的 RPO 或考虑其他可增加带宽的方法以满足当前的 RPO 要求。

  • 源和目标站点之间存在连接问题。

  • 目标站点上可能已出现基础架构更改的情况。

  • 检查站点连接数据以验证源和目标站点之间的连接。

  • 检查目标站点上的基础架构是否已更改或遇到阻止 vSphere Replication 在目标数据存储中写入的问题。例如,更改目标主机的存储带宽管理可能会导致在复制过程中出现存储延迟的情况。

  • 检查 vSphere Replication 管理服务器设备和 vSphere Replication 服务器设备。用户可能已关闭设备或设备失去了连接。

已传输的字节数

使已传输的总字节数与违反 RPO 的次数相关联可能有助于您确定满足 RPO 目标所需的带宽。

表 2. 分析传输字节速率和违反 RPO

图形值

可能的原因

解决方案

  • 较高的传输字节速率和较高的 RPO 违反次数

  • 较低的传输字节速率和较高的 RPO 违反次数

网络带宽可能无法容纳所有复制。

  • 最大化已传输的字节数图形,并使用下拉菜单按虚拟机筛选数据。在某些更改速率较高的虚拟机上禁用复制以允许较低更改速率的虚拟机满足其 RPO 目标。

  • 增加所选主机的网络带宽。

  • 较高的传输字节速率和较低 RPO 违反次数或没有违反情况

  • 较低的传输字节速率和较低 RPO 违反次数或没有违反情况

环境正常运行。

不可用

已复制的虚拟机(按主机)

已复制的虚拟机数(按主机)可帮助您确定复制工作负载在环境中的分布情况。例如,如果某个主机中复制的虚拟机数较高,该主机中的复制作业可能过载。您可能需要验证该主机是否具有足够的资源来维护所有复制作业。如果需要的话,您可以检查已复制虚拟机数量较低的主机并优化环境中的资源分配。