VMware vSphere Replication 8.5 | 2021 年 10 月 5 日 | 内部版本 18710774 | 下载

VMware vSphere Replication 8.5 配置导入/导出工具 | 2021 年 10 月 5 日 | 内部版本 18712590 | 下载

请查看发行说明以了解新增内容及更新。

发行说明内容

本发行说明包含以下主题:

 

新增功能

有关与 VMware vSphere 早期版本或更高版本的互操作性,请参见 vSphere Replication 8.5 兼容性列表

有关 vSphere 7.0 Update 3 功能的信息,请参见 vSphere 7.0 文档

本地化

VMware vSphere Replication 8.5 提供以下语言版本:

  • 英语
  • 法语
  • 德语
  • 日语
  • 韩语
  • 西班牙语
  • 简体中文
  • 繁体中文

产品文档

除了当前发行说明,还可以使用 vSphere Replication 8.5 文档集,其中包含以下交付内容。

 

安装

下载 vSphere Replication .iso 映像并挂载它。您可以在 vSphere Web Client 中使用“部署 OVF”向导来部署 vSphere Replication 设备。导航到此 .iso 映像中的 \bin 目录并使用相应的 OVF 文件:

  1. vSphere_Replication_OVF10.ovf: 使用此文件可安装所有 vSphere Replication 组件,包括 vSphere Replication 管理服务器和 vSphere Replication 服务器。
  2. vSphere_Replication_AddOn_OVF10.ovf: 使用此文件可安装可选的附加 vSphere Replication 服务器。

有关安装的详细信息,请参见 vSphere Replication 文档中心中的“安装 vSphere Replication”一节。

对于 vCenter Server 到 vCenter Server 复制,源和目标站点上的 vSphere Replication 管理服务器版本可以为 8.4 或 8.5。

vSphere Replication 8.5 要求在源站点和目标站点上都具有支持的 vCenter Server 版本。有关详细信息,请参见《VMware 产品互操作性列表》

升级 vSphere Replication

可以使用 ISO 文件和 VAMI 将 vSphere Replication 8.3.x 或 8.4.x 升级到 vSphere Replication 8.5。

无法从 vSphere Replication 设备的 VAMI 使用官方 VMware 更新存储库将 vSphere Replication 从版本 6.5.1 升级到版本 8.5。有关受支持版本的详细信息,请参见兼容性列表

重要信息:在启动升级前,请确认 vSphere Replication 设备具有 OFV 环境或上下文。请参见检查和恢复 vSphere Replication 设备的 OVF 环境 (2106709)

确认您已阅读已知问题下的“升级和常规”部分。

有关升级到 vSphere Replication 8.5 的过程,请参见升级其他 vSphere Replication 服务器升级 vSphere Replication 设备

注意:

  • 如果您正在执行灾难恢复到云的复制,而此时尝试通过 VAMI 升级到 vSphere Replication 8.5,则此升级将失败以防止您丢失这些复制。要避免升级失败,请在升级前取消配置所有灾难恢复到云的复制。要继续使用云恢复,可以使用 VMware vCloud Availability for vCloud Director。有关详细信息,请参见 VMware vCloud Availability 产品文档。
  • 将 vSphere Replication 与 Site Recovery Manager 结合使用时,请先升级受保护站点和恢复站点上的 vSphere Replication,然后再升级 Site Recovery Manager 服务器。升级 vSphere Replication 后,必须重新启动 Site Recovery Manager 服务器。有关详细信息,请参见 VMware Site Recovery Manager 文档。

vSphere Replication 的操作限制

有关 vSphere Replication 8.5 的操作限制,请参见 VMware 知识库。请参见 vSphere Replication 6.x 和 8.x 的操作限制 (KB 2102453)

注意:vSphere Replication 需要其他配置,才能够支持在每个 vSphere Replication 管理服务器上同时进行超过 500 个复制操作。请参见 vSphere Replication 6.x 和 8.х 的操作限制配置升级的 vSphere Replication 设备以支持多达 3000 个复制

 

开源组件

有关适用于 vSphere Replication 8.5 中分发的开源软件组件的版权声明和许可证,请参见 vSphere Replication 开源公开页

 

局限声明和限制

为确保虚拟机复制成功,必须先验证虚拟基础架构符合相关限制要求后,再开始复制。

  • 新增:从 vSphere Replication 8.5.0.3 开始,您可以使用 vSphere Life Cycle Manager (vLCM) 和手动解决办法。请参见 VMware vSphere Replication 8.5.0.3 发行说明
  • 新增:如果在 vSphere Replication 设备上运行 vSphere 阻止客户机操作系统进程向主机发送配置消息过程,vSphere Replication 将停止正常运行。
  • 新增:vSphere Replication 不支持使用两种复制技术保护单个虚拟机。如果使用 VMware Cloud Disaster Recovery 保护虚拟机,则无法使用 vSphere Replication 对其进行保护。
  • vSphere Replication 可以使用虚拟 NVMe 复制虚拟机。vSphere Replication 支持将 NVMe over Fabrics (NVMe-oF) 数据存储作为复制的源和目标。仅当源和目标 ESXi 主机的版本均为 7.0 Update 2 或更高版本时,vSphere Replication 才支持虚拟 NVMe 控制器。有关将 NVMe 技术与 VMware 产品结合使用的详细信息,请参见 VMware vSphere 7.0 文档中的 VMware NVMe 概念
  • 开启虚拟机加密后,vSphere Replication 8.5 将不支持 vSphere 7.0 Update 2。要将虚拟机加密与 vSphere Replication 8.5 结合使用,必须使用 vSphere 7.0 Update 2c 或更高版本。
  • vSphere Replication 8.5 不在 VRMS 设备管理界面中提供支持包管理,包括包含支持包的列表和删除支持包。要通过 SSH 管理支持包,请建立到 vSphere Replication 设备的 SSH 连接。
  • 通过自定义端口安装 Platform Services Controller 时,无法配置 vSphere Replication 设备。
  • 在一个可置备的 vVol 数据存储上,5 分钟 RPO 只能扩展到最多支持 50 个虚拟机。
  • vSphere Replication 在虚拟卷上不支持 VSS 静默。
  • vSphere Replication 无法复制共享 vmdk 文件的虚拟机。
  • vSphere Replication 不支持源站点和目标站点上的 vSphere APIs for IO Filtering。无法复制分配有包含 IO 筛选器的虚拟机存储策略的虚拟机,也无法将此类策略分配给复制目标虚拟机。在配置虚拟机以进行复制之前,请确保分配给虚拟机的虚拟机存储策略不包含 IO 筛选器。请勿将包含 IO 筛选器的虚拟机存储策略分配给已配置以进行复制的虚拟机。
  • 如果部署多个 vSphere Replication 设备,VRMS 设备管理界面将在初始配置过程中生成警告。用户需要确认是否继续部署新设备。部署多个 vSphere Replication 服务器时不会发生这种情况。
  • 每个 vSphere Replication 管理服务器最多可管理 3000 个复制的虚拟机。请参见配置升级的 vSphere Replication 设备以支持多达 3000 个复制 (KB 2102463)环境要求...(KB 2107869)
  • vSphere Replication 支持的最大磁盘大小为 62 TB。如果您尝试在磁盘容量大于 62 TB 的虚拟机上启用复制,该虚拟机将不执行任何复制操作,并且无法打开虚拟机电源。
  • vSphere Replication 会在大于 2TB 的磁盘上跟踪较大的块。在相同的工作负载下,大于 2TB 的磁盘的复制性能可能会不同于小于 2TB 的磁盘,具体取决于特定的一组更改块通过网络传输所使用的磁盘空间量。
  • vSphere Replication 不支持升级 vSphere Replication 设备中的 VMware Tools 软件包。
  • vSphere Replication 支持复制虚拟兼容模式下的 RDM。不能配置物理兼容模式下的 RDM 进行复制。
  • vSphere Replication 不复制目标站点上的虚拟机快照层次结构。
  • 可以配置已关闭电源的虚拟机进行复制。但是,实际复制流量会在虚拟机打开电源时开始发送。
  • 在复制站点使用 Storage DRS 时,确保您拥有同类主机和数据存储连接,以防止 Storage DRS 针对副本磁盘执行消耗资源的跨主机移动(更改主机和数据存储)。
  • 5 分钟的 RPO 要求源主机为 ESXi 6.5。
  • 要使用网络隔离功能,vSphere Replication 要求使用 ESXi 6.0 或更高版本的主机。
  • vSphere Replication 不支持 VMware vSphere® Trust Authority™。
  • vSphere Replication 未与 vSphere Lifecycle Manager (vLCM) 集成。您不得在同一数据中心运行 vSphere Replication 和 vLCM,因为 vLCM 会导致 vSphere Replication 停止。
  • 使用 TRIM/UNMAP 命令回收空间时,如果在源站点使用 UNMAP 命令,则复制流量会将该命令作为一大串零发送,除非在复制中使用压缩。数据在目标站点上存储为零,并且不会回收副本磁盘上的空间。

已知问题

已知问题分为如下类别。

升级
  • 新增:无法将 vSphere Replication 设备升级到版本 8.5

    尝试将 vSphere Replication 设备升级到版本 8.5 时,该过程失败,但不显示错误或警告。如果日志分区 (/opt/vmware/logs) 已满,则会出现此问题。

    解决办法:升级到 vSphere Replication 8.5 之前,清理日志分区。

  • 升级后,vSphere Replication 管理服务不启动

    升级 vSphere Replication 后,vSphere Replication 管理 (VRM) 服务在 VAMI 中显示为停止,并且 虚拟设备中的 /opt/vmware/hms/logs/hms-configtool.log 文件包含 java.net.ConnectException:Connection refused

    由于 vPostgreSQL 服务未完全启动而导致嵌入式数据库架构的升级进程失败时,会出现此问题。

    解决办法:

    1. 在虚拟设备控制台中,以 root 用户身份登录。
    2. 运行下列命令:$ /opt/vmware/hms/bin/hms-configtool -cmd upgrade -configfile /opt/vmware/hms/conf/hms-configuration.xml

      数据库架构升级启动。

    3. 等待数据库升级进程完成。
    4. 在 vSphere Replication VAMI 中,导航到配置选项卡并完成该设备的 SSO 注册。
  • 在升级 vSphere Replication 设备或者更改证书或 IP 地址后,缺少 vSphere Replication 权限

    如果您升级了 vSphere Replication 设备,或者由于某种原因导致 vSphere Replication 设备的证书或 IP 地址发生了变化,分配给默认 VRM 用户角色的权限将会被删除。
    每当取消注册 vSphere Replication 扩展后又向 vCenter Server 扩展管理器注册时,就会遇到该问题。

    解决办法:请先克隆预定义的 VRM 角色,并创建自定义角色,然后再升级 vSphere Replication 设备,或者更改其证书或 IP 地址。分配给自定义角色的权限不会被移除。

  • vSphere Replication 虚拟设备管理界面 (VAMI) 在升级后不可访问

    升级后,vSphere Replication VAMI 发生更改,无法通过升级前所用的浏览器窗口进行访问。

    解决办法:执行以下操作之一。

    • 更改打开 VAMI 的浏览器。
    • 关闭整个浏览器并打开一个新的浏览器窗口以连接到 VAMI。
    • 清除浏览器的缓存。
    • 在浏览器中打开隐身标签页。
常规
  • 新增:将不同数据存储中的种子副本磁盘移至一个数据存储失败

    尝试将不同数据存储中具有相同名称的种子副本磁盘移至一个数据存储时,该过程将失败。具有相同名称的种子副本磁盘不能存在于同一位置。

    解决办法:在移动前重命名种子副本磁盘。

  • 新增:将已恢复的加密虚拟机恢复到快照失败并显示错误

    恢复启用了多个时间点 (MPIT) 快照的加密虚拟机的复制时,虚拟机加密不会应用于恢复后创建的时间点 (PIT) 快照。尝试恢复到已恢复加密虚拟机的快照将失败,并显示以下错误:无法打开快照文件 (Unable to open the snapshot file)。

    解决办法:无。

  • 新增:如果您的第二个 NIC 配置了静态路由集,则“摘要”选项卡中会出现意外错误

    如果您有第二个网卡,并且为其配置了静态路由集,则 VRMS 设备管理界面无法从第二个网卡获取 IP 地址。这可能会导致在“摘要”选项卡下的“用于入站存储流量的 IP 地址”字段中显示以下意外错误:

    存储流量 IP 地址 <IP_address> 必须与其中一个网卡 IP 地址相匹配 (The Storage Traffic IP address <IP_address> must match one of the NIC IP addresses)

    解决办法:正确配置网卡,然后您可以忽略该错误。 
    可以运行以下命令,验证复制流量是否使用正确的 IP 地址:
    cat /etc/vmware/hbrsrv-nic.xml

  • 新增:升级 vCenter Server 后,Site Recovery UI 中可能会显示错误消息

    将 vCenter Server 升级到版本 6.7 Update 3p 或版本 7.0 Update 3 P04 后,打开 Site Recovery UI 时,可能会看到以下错误消息:“用户未登录。由于缺少特权而终止方法执行 (User is not logged in. Terminating method execution due to lack of privileges)。”dr.log 和 HMS 日志中也会显示相同的错误。

    解决办法:无。忽略该错误。

  • 新增:从 vSphere Replication 管理服务器 (VRMS) 设备管理用户界面配置 VRMS 失败并显示错误

    如果配置 vCenter Server 时使用端口 80 以外的自定义 HTTP 端口,则从 VRMS 设备管理用户界面配置 VRMS 失败并显示以下错误:

    无法注册 VRMS

    解决办法:要发现自定义 vCenter Server 端口并调整 VRMS 配置工作流以使用此端口,请参见 https://kb.vmware.com/s/article/85918

  • 新增:复制的虚拟机变得无响应或无法处理网络请求

    执行 vSphere Replication 同步操作过程中,虚拟机磁盘 I/O 在同步期间阻塞。如果 SCSI UNMAP 命令替代当前复制磁盘到目标站点的传输,则 vSphere Replication 筛选器驱动程序会在同步操作期间使这些命令失败。

    解决办法:允许 vSphere Replication 适应 UNMAP 命令。 

    1. 建立与 ESXi Server 的 SSH 连接。
    2. 运行下列命令:

    esxcli system settings advanced set -o /HBR/DemandlogFailCollidingUnmap -i 0

    该命令立即生效,您无需重新启动系统。

  • 新增:重新保护失败并显示错误

    大规模复制虚拟机时,重新保护可能会失败,并显示以下错误:“无法撤消复制虚拟机。vSphere Replication 管理服务器中出现一般错误‘java.net.SocketTimeoutException: 读取已超时’(Unable to reverse replication for the virtual machine A generic error occurred in the vSphere Replication Management Server "java.net.SocketTimeoutException: Read timed out")

    解决办法:

    1. 导航到 /opt/vmware/hms/conf/hms-configuration.xml 文件。
    2. 将两个站点的 hms-default-vlsi-client-timeout 值增加到 15 分钟。
    3. 重新启动 HMS 服务。
  • 新增:同时移除磁盘并将磁盘添加到源虚拟机时,复制将进入“错误”状态。

    自动包括新磁盘选项处于启用状态。如果编辑虚拟机的设置,在单个任务中同时移除其中一个磁盘并添加新磁盘时,复制可能会进入“错误”状态。

    解决办法 1:在 Site Recovery UI 中手动重新配置复制。

    解决办法 2:修改虚拟机时,通过两个单独的任务添加新磁盘和移除磁盘

  • 新增:在同一 SCSI 设备上更换磁盘时,不会启动自动复制

    自动复制新磁盘处于启用状态。如果使用一个步骤,在同一 SCSI 设备上同时移除和添加受保护磁盘,复制将进入错误状态: 

    vSphere Replication 服务器上的磁盘集与源复制“<vm name>”集不匹配 (The set of disks on the vSphere Replication Server does not match the source set for replication '<vm name>')。

    解决办法 1:利用两个分开的配置操作更换磁盘。 

    解决办法 2:如果使用单个配置操作更换 SCSI 设备上的磁盘,请重新配置复制。

  • 新增:修改虚拟机磁盘配置时,复制将进入“错误”状态

    当虚拟机是正在进行的复制的一部分,并且您修改了虚拟机存储配置(添加、删除或调整磁盘大小)时,此操作将启动复制重新配置任务。如果此复制上已在进行另一个重新配置操作,则复制可能会进入“错误”状态并显示错误。例如,“配置规范无效。某些磁盘未指定用于复制,也未排除 (Invalid configuration spec. Some disks are not specified for replication, nor excluded)。”错误。

    解决办法:手动重新配置复制。

  • 新增:如果重新配置复制,将新存储策略分配给目标不是 vSAN 目标数据存储的复制虚拟磁盘,则该策略不会应用于目标站点上的副本磁盘

    首次配置或恢复复制时,存储策略将应用于目标站点上的副本磁盘。如果将复制重新配置为使用新存储策略,并且复制虚拟磁盘的目标不是 vSAN 目标数据存储,则此更改不会自动反映在配对站点中。

    解决办法:

    1. 使用重新配置的复制恢复虚拟机。
    2. 使用 vSphere Client,将已恢复虚拟机的存储策略更改为新策略。
    3. 从 vCenter Server 清单中取消注册已恢复的虚拟机。
    4. 使用种子和新存储策略再次配置复制。
  • 重新保护操作失败

    如果在启用静默功能的情况下配置复制,并且目标站点上 ESXi 主机的版本为 7.0 或 7.0 Update 1,则重新保护操作会失败。

    解决办法:停用优化的重新保护功能。

    1. 与 vSphere Replication 设备建立 SSH 连接。
    2. 运行下列命令:/opt/vmware/hms/bin/hms-configtool -cmd reconfig -property reprotect-optimization-enabled=false
    3. 重新启动 HMS 服务。

    此问题在 ESXi 版本 7.0 Update 2 中已得到解决。
     

  • 如果尝试在调整磁盘大小后运行同步操作,该操作将失败。

    磁盘大小调整操作可能需要几个小时才能完成,具体取决于磁盘大小。如果尝试同时运行同步操作,即使复制状态为“正常”,操作也将失败。

    解决办法:等待磁盘大小调整操作完成。可以通过查看 /var/log/vmware/hbrsrv.log 日志文件验证完成情况,在该日志文件中,应能够看到以下条目:

    Resizing disk <replicated disk ID>

  • 使用 vSphere Native Key Provider 加密的虚拟机的复制恢复失败

    如果从配置了本机密钥提供程序的集群中移除与目标数据存储连接的所有主机,则现有复制将保持正常状态。但是,如果您尝试执行恢复,恢复将失败,并且复制将进入“错误”状态。

    解决办法:使数据存储再次可从集群访问。如果没有尝试恢复且复制仍处于正常状态,请重新配置复制,并将目标数据存储更改为集群可访问的数据存储。

  • 在执行重新保护操作时,不会复制新添加的虚拟磁盘

    如果执行恢复并向已恢复的虚拟机添加新磁盘,则执行重新保护操作时不会复制新磁盘。即使将初始复制配置为自动复制新磁盘,也不会自动复制新磁盘。

    解决办法:手动将新磁盘包含在复制中。

  • 生成支持包失败

    如果在未配置 vSphere Replication 设备的情况下尝试生成支持包,该过程将失败。

    解决办法:手动生成 vSphere Replication 设备和嵌入式 vSphere Replication 服务器的支持包。生成的文件为 /tmp/hms-bundle.tar.gz/tmp/embedded-hbr-bundle.tgz

    1. 与 vSphere Replication 设备建立 SSH 连接。
    2. 运行以下命令:

      /bin/tar --force-local --ignore-failed-read -chvpf /tmp/hms-bundle.tar /opt/vmware/hms/logs /opt/vmware/var/log /opt/vmware/support/logs/dr /opt/vmware/support/logs/drconfigui /opt/vmware/support/logs/envoy
      /usr/bin/gzip --no-name --quiet --stdout /tmp/hms-bundle.tar > /tmp/hms-bundle.tar.gz
      /urs/bin/rm /tmp/hms-bundle.tar​
      /usr/bin/sudo -u root /usr/bin/hbrsrv-support-bundle.sh -f /tmp/embeded-hbr-bundle.tgz

       
    3. 导航到相应的嵌入式 vSphere Replication 服务器的 VMware VRMS 设备管理,并生成支持包。
  • 恢复操作没有进展

    如果在较短时间内先从复制中排除具有 vVOL 目标数据存储的虚拟磁盘,然后再次包含该虚拟磁盘,则可能会影响后续的恢复操作。如果尝试执行恢复,恢复可能不会继续进行。

    解决办法 1:

    如果已启动恢复操作:

    1. 移除复制,这将保留副本磁盘。
    2. 使用种子重新配置复制。
    3. 执行恢复操作。

    解决办法 2:

    如果尚未启动恢复操作:

    1. 排除具有 vVOL 目标数据存储的磁盘。
    2. 同步复制。
    3. 再次包含磁盘。
    4. 执行恢复操作。
  • 复制同步没有进展

    如果在较短时间内先从复制中排除具有 vVOL 目标数据存储的虚拟磁盘,然后再次包含该虚拟磁盘,则可能会影响后续的复制同步操作。如果尝试执行复制同步,可能不会继续进行。

    解决办法: 

    1. 排除具有 vVOL 目标数据存储的磁盘。
    2. 同步复制。
    3. 再次包含磁盘。
  • 无法对 vSphere Replication 使用网络加密

    尝试为复制配置网络加密时,“配置复制”向导中的选项处于非活动状态。如果使用的是 ESX 版本 6.5,则 hbr-agent.vib 不会自动安装在 ESX 6.5 主机上,您将无法为这些复制配置网络加密。

    解决办法:

    1. 与 vSphere Replication 设备建立 SSH 连接。
    2. 运行下列命令: /opt/vmware/hms/bin/hms-configtool -cmd reconfig -property hms-auto-install-hbragent-vib=false
    3. 重新启动 HMS 服务。
    4. 下载并安装 vSphere Replication 8.5 的 hbr-agent.vib,并将其安装到 ESX 6.5 主机。请参见 https://kb.vmware.com/s/article/2110304
  • 尝试通过 VMware VRMS 设备管理配置 IPv6 时,会收到“属性无效 - dns (invalid property - dns)”错误

    尝试通过 VMware VRMS 设备管理配置 IPv6 并选择“通过路由器通告自动获取 IPv6 设置”选项和自动分配的 DNS 时,将出现错误“属性无效 - dns (invalid property - dns)”。 

    解决办法:通过 SSH 连接到 vSphere Replication 设备主机,并运行 $netmgr ip6_address --set --interface --dhcp 0 --autoconf 1。要通过 DHCP 接收 IP 地址,请改为运行 $netmgr ip6_address --set --interface --dhcp 1 --autoconf 1

  • 无法通过 VMware VRMS 设备管理重新配置 IPv6 设置

    如果您已为 IPv6 网络配置了“通过路由器通告自动获取 IPv6 设置”或“通过 DHCP 自动获取 IPv6 设置”选项,则无法仅使用“通过 DHCP 自动获取 IPv6 设置”重新配置 IPv6 设置。必须同时选择这两个选项,或者两个选项都不选。

    解决办法:通过 SSH 连接到 vSphere Replication 设备主机,并运行 $netmgr ip6_address --set --interface --dhcp 0 --autoconf 1
    要通过 DHCP 接收 IP 地址,请改为运行 $netmgr ip6_address --set --interface --dhcp 1 --autoconf 1

  • 移除磁盘,然后将同一磁盘添加到源虚拟机上的不同虚拟设备节点后,重新配置复制失败

    如果移除一个虚拟磁盘并使用相同的 VMDK 文件添加新磁盘,然后尝试执行手动或自动(如果启用了“自动包含新磁盘”选项)重新配置复制,则该过程将失败并出现以下错误:
         
     Cannot reconfigure replication group '<VM_ID>' (managed object ID: 'GID-<group-ID>').详细信息: 'Duplicate key (hms.Disk) { dynamicType = null, dynamicProperty = null, deviceKey = <DEVICE_KEY>, destination = (hms.ExtendedDatastorePath) { dynamicType = null, dynamicProperty = null, datastore = MoRef: type = Datastore, value = <DATASTORE>, serverGuid = null, path = <PATH>, fileName = <FILENAME>, dsCluster = null }, storageProfileId = null, useOfflineCopy = false, virtualDiskType = thin, skipDiskUuidValidation = true, replicationDiskId = null, contentId = null, capacityInKb = <CAPACITY> }'.ThrowableProxy.cause The operation is not allowed in the current state.

    解决办法

    1. 停止复制并保留副本磁盘。
    2. 使用磁盘作为种子再次配置复制。
  • 从 vSphere Trust Authority 切换到 KMS 加密机制后,配置复制失败

    如果使用 vSphere Trust Authority 加密机制,但切换回使用 KMS 服务器的旧加密机制,然后尝试配置复制,则该过程可能会失败。出现此问题的原因是,切换加密机制后,加密密钥可能未正确分发到目标主机。

    解决办法:重新启动 HMS 服务。

  • 在远程站点上重新配置复制失败并显示错误

    尝试在远程站点上重新配置复制时,该过程失败并显示以下错误:

    Failed to reconfigure replication because of java.lang.NullPointerException at com.vmware.hms.replication.SecondaryGroupImpl.reconfigureVirtualMachine(SecondaryGroupImpl.java:3163) at com.vmware.hms.replication.SecondaryGroupImpl.scheduledReconfigure(SecondaryGroupImpl.java:2840) at com.vmware.hms.replication.SecondaryGroupImpl.access$3(SecondaryGroupImpl.java:2812) at com.vmware.hms.replication.SecondaryGroupImpl$2.go(SecondaryGroupImpl.java:2780) at com.vmware.hms.task.TaskRunnable.run(TaskRunnable.java:71) at com.vmware.hms.HmsTaskManager$2.run(HmsTaskManager.java:519) at com.vmware.hms.util.executor.LoggerOpIdConfigurator$RunnableWithDiagnosticContext.run(LoggerOpIdConfigurator.java:133) at com.vmware.hms.util.executor.LoggerOpIdConfigurator$2.run(LoggerOpIdConfigurator.java:100)
            
    仅当 vSphere Replication 设备从 8.1.0 之前的版本(例如 6.5 及更低版本)升级时,才会发生此问题。

    解决办法: 

    1. 与 HMS 设备建立 SSH 连接。
    2. 导航到 /opt/vmware/hms/bin/.
    3. 要检查问题是否来自特定的复制,请运行以下命令:

      ./embedded_db_connect.sh --no-align --tuples-only -c "select diskentity.isnativesnapshotsupported, secondaryvirtualmachineentity.name from diskentity, secondaryvirtualmachineentity where secondaryvirtualmachineentity.movalue = diskentity.vm_movalue;"
       
    4. 如果步骤 3 中运行的命令返回任何结果,请同时运行以下命令:

      ./embedded_db_connect.sh --no-align --tuples-only -c "update diskentity set isnativesnapshotsupported = false from secondaryvirtualmachineentity where secondaryvirtualmachineentity.movalue = diskentity.vm_movalue;"
       
    5. 使用 systemctl restart hms 命令重新启动 HMS 服务。

     

     

  • 测试恢复失败并显示错误

    如果配置到 VMFS 数据存储的复制,然后将此组的任何磁盘重新配置为复制到 vSAN 数据存储(而虚拟机主页仍配置为 VMFS 数据存储),则尝试执行测试恢复时,操作会失败,并显示以下错误:

    无法为 vSphere Replication 服务器上的组“<group-ID>”创建测试泡状映像 (Cannot create a test bubble image for group '<group-ID>' on vSphere Replication Server)...

    解决办法 1:将所有副本磁盘重新配置为使用 VMFS 数据存储。

    解决办法 2:重新配置虚拟机主页以复制到 vSAN 数据存储。

  • 使用网络加密的复制显示处于“非活动”状态

    默认情况下,当您打开 vSphere Replication 设备的电源时,vSphere 安装捆绑包 (VIB) 会安装在部署该设备的 vCenter Server 清单中所有受支持的 ESXi 主机上。由于不同的原因,VIB 文件的自动安装可能会失败。

    解决办法:

    在托管复制源虚拟机的每个 ESXi 实例上安装 vSphere Replication VIB 文件。

    1.暂时停用 ESXi 主机上的防火墙。
    2.建立与 ESXi Server 的 SSH 连接。
    3.运行下列命令:
    $ esxcli software vib install -v https://VR_APPLIANCE_IP:8043/vib/vmware-hbr-agent.vib
    4.启用 ESXi 主机上的防火墙。

  • 无法配置使用网络加密的新复制

    默认情况下,当您打开 vSphere Replication 设备的电源时,vSphere 安装捆绑包 (VIB) 会安装在部署该设备的 vCenter Server 清单中所有受支持的 ESXi 主机上。由于不同的原因,VIB 文件的自动安装可能会失败。 

    解决办法:

    在托管复制源虚拟机的每个 ESXi 实例上安装 vSphere Replication VIB 文件。

    1.暂时停用 ESXi 主机上的防火墙。
    2.建立与 ESXi Server 的 SSH 连接。
    3.运行下列命令:
    $ esxcli software vib install -v https://VR_APPLIANCE_IP:8043/vib/vmware-hbr-agent.vib
    4.启用 ESXi 主机上的防火墙。

  • 使用 vSphere Replication 导入/导出工具导入或导出复制配置数据失败并显示错误

    如果将 vSphere 6.5 与 vVol 数据存储结合使用,并尝试导入或导出复制配置数据,该操作将失败,并显示以下错误:

    无法配置复制: 出现了常规系统错误: 无效故障 (Unable to configure replication: A general system error occurred: Invalid fault)

    解决办法 1:使用不同类型的数据存储,例如 vSAN、VMFS 或 NFS。
    解决办法 2:升级到 vSphere 6.7 或 vSphere 7.0。

  • 如果要复制的源虚拟机在 ESXi 6.7 或 6.7 Update 1 上运行,初始同步或完全同步可能尚未完成即停止进行

    针对源虚拟机在 ESXi 6.7 或 6.7 Update 1 上运行的复制所进行的同步仍在进行中,但复制详细信息中的校验和字节值没有进度。关闭电源、生成快照、恢复到快照和迁移等操作失败,并显示超时或任务正在进行中 (Task in progress) 错误。

    解决办法: 

    1.在 ESXi 的“高级”设置中,通过设置 HBR.ChecksumUseChecksumInfo = 0 来停用 vSphere Replication 校验和。

    2.迁移所有虚拟机并关闭 ESXi 主机上无法迁移的虚拟机的电源。

    3.将主机置于维护模式。

    4.重新引导 ESXi 主机。

    执行这些步骤后,将停用同步过程的校验和部分,且所有分配的块都将发送到远程站点,而无论它们是否相同。此外,也不能使用种子。

  • 如果要复制的源虚拟机在 ESXi 6.7 或 6.7 Update 1 上运行,复制同步看似在进行,但复制实例始终无法成功完成

    在 ESXi 6.7 和 6.7 Update 1 中,为并行传输调度的需求日志块数可能超出可传输的实际数量。如果要复制在此类主机上运行的虚拟机,并且存在目标主机较慢或临时网络错误问题,则可能会导致复制失败,并出现“DiskQueue 已满 (DiskQueue is full)”错误。

    解决办法:

    1. 将所有虚拟机移至另一个 ESXi 主机。
    2. 在 ESXi 的“高级”设置中编辑 HBR.DemandlogTransferMaxNetwork 的值,将其从默认的 64 更改为 63。
    3. 将 ESXi 主机置于维护模式。
    4. 重新引导 ESXi 主机。
  • 在 vSphere UI 中右键单击复制的虚拟机并选择“重新配置复制”时,会在 Mozilla Firefox 浏览器中阻止 Site Recovey UI 的弹出窗口,且不显示通知

    默认情况下,Site Recovery UI 在新选项卡中打开。在 vSphere UI 中右键单击复制的虚拟机并选择“重新配置复制”时,会在 Mozilla Firefox 浏览器中阻止 Site Recovey UI 的弹出窗口,且不显示通知。

    解决办法:从 Mozilla Firefox 的“选项”菜单中,选择“内容”选项卡,然后将 vCenter Server 的 URL 添加到弹出窗口例外列表中。 

  • Site Recovery UI 变得不可用,持续显示 403 - OK 错误消息

    Site Recovery UI 不显示任何数据并显示错误 403 - OK。

    解决办法:

    1.从 Site Recovery UI 注销并重新登录。

    2.停用浏览器的“还原上次会话”复选框。对于 Chrome,停用“从上次停止的位置继续”选项。

  • 如果在配置复制时使用 vVol 目标数据存储上的种子,虽然配置会成功,但复制将处于“错误”状态

    如果在配置复制时使用具有快照的虚拟机作为种子,虽然配置操作会成功,但复制会在“初始完全同步”结束后进入“错误”状态。此时会出现类似于以下错误描述的问题:
    "A replication error occurred at the vSphere Replication Server for replication 'vmname'.Details: “(datastoreUUID: "vvol:9148a6192d0349de-94149524b5f52bc4")、(diskId: "RDID-fd3ed4de-2356-43c7-a0e2-7bc07a7da012")、(hostId: "host-33")、(pathname: "vmname/vmname.vmdk")、(flags: retriable): Class: NFC Code: 10; NFC error: NFC_DISKLIB_ERROR (Input/output error); Set error flag: retriable; Can't write (multiEx) to remote disk; Can't write (multi) to remote disk'.”

    解决办法:从种子虚拟机中删除快照。

  • vSphere Replication 在完全同步期间失败,出现错误:vSphere Replication 服务器上出现复制错误 (A replication error occurred at the vSphere Replication Server)

    vSphere Replication 在完全同步期间可能会失败,并显示以下错误:
    A replication error occurred at the vSphere Replication Server for replication <group_name>.Details: “(datastoreUUID: "...")、(diskId: "...")、(hostId: "...")、(pathname: "..."), (flags: retriable, pick-new-host, nfc-no-memory): Class: NFC Code: 5; NFC error: NFC_NO_MEMORY; Set error flag: nfc-no-memory; Code set to: Host unable to process request.; Set error flag: retriable; Set error flag: pick-new-host; Can't write (single) to remote disk'.

    通常,此错误是暂时的,一段时间后,该操作将会成功。

  • 替换 vCenter Server 的 SSL 证书导致 vSphere Replication 中出现证书验证错误

    如果替换了 vCenter Server 系统上的 SSL 证书,则 vSphere Replication 尝试连接 vCenter Server 时出现连接错误。

    解决办法:有关如何更新 vCenter Server 证书并让诸如 vSphere Replication 等解决方案能够继续正常运行的信息,请参见 http://kb.vmware.com/kb/2109074

  • 数据同步失败,且源 vSphere Replication 管理服务器的日志文件包含错误 DeltaAbortedException

    如果在数据同步期间您的环境出现连接问题,您可能会发现以下问题。

    • 复制组同步失败,且源站点的 vSphere Replication 管理服务器中的 hms<n>.log 文件包含以下错误消息:
      DeltaAbortedException
    • 在 Site Recovery Manager 中,复制组同步失败,并出现以下错误消息:
      VRM 组 <group_name> 的 VR 同步失败 (VR synchronization failed for VRM group <group_name>)。vSphere Replication 管理服务器中出现一般错误。异常详细信息: “com.vmware.hms.replication.sync.DeltaAbortedException”(VR synchronization failed for VRM group <group_name>. A generic error occurred in the vSphere Replication Management Server. Exception details: 'com.vmware.hms.replication.sync.DeltaAbortedException')。

    解决办法:在继续操作前,先解决环境中的连接问题。

  • 如果同时恢复多个复制且自最新同步后累积了大量增量,使用“同步最新更改”进行故障切换将失败,并出现 SocketTimeoutException 错误

    当相同网络中存在大量复制流量时,vSphere Replication 管理服务器可能无法通过 vCenter 反向代理接收应有的响应。某些复制管理或监控操作可能会失败,并出现以下错误消息:
    “com.vmware.vim.vmomi.client.exception.ConnectionException: java.net.SocketTimeoutException: 读取已超时 (com.vmware.vim.vmomi.client.exception.ConnectionException: java.net.SocketTimeoutException: Read timed out)”

    解决办法:为 vSphere Replication 流量配置网络流量隔离,以便 vCenter 和 vSphere Replication 管理服务器之间的管理通信不会受大量复制流量的影响。请参见隔离 vSphere Replication 网络流量

  • 恢复期间会覆盖位于目标文件夹中的虚拟机

    如果目标文件夹包含名称与已复制虚拟机相同的已注册虚拟机,则在恢复期间会覆盖该已注册虚拟机。启动“恢复”向导后,vSphere Replication 会检查目标文件夹,并显示一个供您确认覆盖操作的对话框。在极少数情况下,在完成目标检查后,且在向导仍处于打开状态时,可能会将虚拟机注册到目标文件夹。在这些情况下,将覆盖已复制到目标文件夹的虚拟机,而不另行通知。

    解决办法:无。

  • 在更改目标站点上的 vSphere Replication 服务器的 IP 地址后,复制将显示“非活动 (违反 RPO)”状态

    如果目标站点上的 vSphere Replication 服务器的 IP 地址发生更改,则此站点的所有复制的状态都将变为“非活动 (违反 RPO)”。出现此问题是因为,当 IP 地址发生更改时,未自动重新配置源站点上的复制。

    解决办法:重新配置所有复制,以便源主机使用目标 vSphere Replication 服务器的新 IP 地址。

  • 初始完全同步期间出现暂时性“错误”状态

    在初始同步期间,您可能会发现同步状态临时更改为“错误”,并多次回到正常状态。该错误状态可能表明目标站点上的资源不足。如果由于同步操作所导致的 IO 工作负载高于目标主机可以处理的负载,则复制的状态将变为“错误”。IO 工作负载减少后,该错误将消失。

    解决办法:在正在运行复制源虚拟机的每个 ESXi 主机上,减少名为 HBR.TransferMaxContExtents 的主机配置选项的值。默认值为 8,较低的值将减少在一次同步更新期间发送的数量块大小,但会增加初始完全同步的持续时间。在初始完全同步后,将该值更改回其默认值 (8) 以获得最大的 RPO 性能。如果在增量同步期间继续出现暂时性错误,则可能意味着每次增量期间传输了大量已更改块,而目标站点上的主机无法容纳所产生的 IO 工作负载。在这种情况下,请保持 HBR.TransferMaxContExtents 配置选项为较低值。
    或者,可以向辅助站点添加多个主机。

  • 已分配 VRM 管理员或 VRM 虚拟机复制角色的用户无法访问“配置复制”向导

    如果已分配预定义的 VRM 管理员或 VRM 虚拟机复制角色的用户登录 Site Recovery 用户界面并尝试配置复制,则不会启动“配置复制”向导。

    解决办法:克隆默认角色以向其添加配置文件驱动的存储 -> 配置文件驱动的存储视图特权,然后将克隆的角色分配给用户。

  • 虽然客户机操作系统支持静默,但在“配置复制”向导中为已关闭电源的复制源虚拟机停用了启用静默的选项

    对于 Linux 和 Windows 源,系统根据有关客户机操作系统的信息启用“启用静默”选项。如果虚拟机尚未打开电源,则 ESXi 主机将始终报告不支持静默,因为客户机操作系统信息不可用。

    解决办法:验证复制源虚拟机是否在配置复制前至少已打开电源一次。

  • 更改 vCenter Server 证书之后将无法访问 vSphere Replication 服务

    如果 vCenter Server 证书更改,则 vSphere Replication 无法访问。

    解决办法:请参见更改 vCenter Server 证书之后将无法访问 vSphere Replication

  • vSphere Replication 管理服务器 (VRMS) 可能在恢复失败后在目标 vCenter Server 中泄露部分恢复的虚拟机

    在极少数情况下,在恢复期间,VRMS 在目标 vCenter Server 中注册已恢复虚拟机后可能会立即停止。复制详细信息面板中的最新恢复错误消息为:VRM 服务器无法完成操作 (VRM Server was unable to complete the operation)。当 VRMS 重新启动时,它会清理部分恢复的虚拟机文件。在某些情况下,无法从目标 vCenter Server 取消注册虚拟机。随后的恢复尝试会在恢复向导中显示一条错误消息,说明选定的虚拟机文件夹已包含具有相同名称的实体。

    解决办法:手动从目标 vCenter Server 移除虚拟机,但是保留它的磁盘,因为它们指向副本占位文件。

  • 在 vSphere Replication 中恢复的虚拟机无法在 vCenter Server 中打开电源

    使用 vSphere Replication 在虚拟机上运行恢复时,恢复失败,并且复制的状态不为 [已恢复]。虚拟机已在 vCenter 清单中注册,但当您尝试打开其电源时,操作失败并显示错误:未找到文件 [datastorename] 路径/vmname.vmx (File [datastorename] path/vmname.vmx was not found)。作为 vSphere Replication 恢复工作流的一部分,虚拟机注册在 vCenter Server 中可能会成功,但由于存在临时性网络错误,响应可能未抵达 vSphere Replication 管理服务器。由于虚拟机注册错误,vSphere Replication 会恢复复制映像并报告失败的恢复任务。如果您启动了其他恢复,操作将失败并显示同名虚拟机已在 vCenter Server 中注册消息。

    解决办法:从 vCenter Server 清单中移除部分恢复的虚拟机。请勿从磁盘中删除文件。重试恢复。

  • 在复制多个虚拟机期间,vSphere Replication 服务器可能进入不接受更多的 VRMS 连接但继续复制虚拟机的状态

    解决办法:重新引导 vSphere Replication 服务器。

  • vSphere Replication 操作失败,并显示“未进行身份验证 (Not Authenticated)”错误

    如果在某个站点上启动一个操作,例如在虚拟机上配置 vSphere Replication,然后在其他站点上重新启动 vCenter Server 和 vSphere Replication 设备,则 vSphere Replication 操作将失败,并显示错误:VRM 服务器一般错误 (VRM Server generic error)。请查看文档了解任何故障排除信息。详细的异常为: “com.vmware.vim.binding.vim.fault.NotAuthenticated”。出现此问题是因为在重新启动 vCenter Server 和 vSphere Replication 设备之前,vSphere Replication 服务器在缓存中保留了连接会话。

    解决办法:通过注销 vSphere Web Client 并重新登录,清除 vSphere Replication 连接缓存。

  • 在 vSphere Replication 管理服务器中执行操作失败并显示错误“...UnmarshallException”

    vSphere Replication 管理服务器遇到高负载或暂时性网络错误时,由于通信层中存在错误,执行操作可能会失败并显示错误 UnmarshallException。

    解决办法:重新尝试失败的操作。

  • 安装更新时,VAMI 可能无响应

    升级 vSphere Replication 时,由于 VAMI 未响应,因此,即使在成功安装更新后,状态消息“正在安装更新 (Installing Updates)”可能也不会消失。

    解决办法:在浏览器中刷新 VAMI UI 或在新选项卡中打开 VAMI UI。

  • 复制流量太大时 vSphere Replication 操作失败

    vSphere Replication 操作可能失败并且显示错误 java.net.UnknownHostException。这些错误是由于网络阻塞导致 DNS 请求丢失引起的。

    解决办法:通过配置流量调整、服务质量或 vSphere Replication 设备上的 DNS 来配置网络,确保管理流量不会丢失。一种可行的解决方案是修改 vSphere Replication 设备的网络地址缓存策略。

    1. 以 root 身份登录 vSphere Replication 设备。
    2. 在编辑器中打开文件 /usr/java/jre-vmware/lib/security/java.security
    3. 取消 networkaddress.cache.ttl 行的注释,并将其值设置为至少 86400 秒(24 小时)或完成初始完全同步所需的最长时间。
    4. 保存文件并重新引导 vSphere Replication 设备。
    5. 为所有剩余 vSphere Replication 设备重复此步骤。
到 vCenter Server 的复制
  • 新增:配置到新注册虚拟机的复制失败并显示错误

    如果在优化的重新保护模式下成功执行故障切换后,移除恢复的虚拟机,然后重新注册该虚拟机,则尝试为此虚拟机配置复制时,该过程将失败,并显示以下错误:

    虚拟机“<VM_ID>”在其他复制组中以优化重新保护模式恢复。要为虚拟机配置新的复制,必须先移除现有已恢复复制 (VM ‘<VM_ID>’ was recovered in optimized reprotect mode in another replication group. To configure new replication for the VM, you must first remove the existing recovered replication)。

    解决办法:在此虚拟机上停用 vSphere Replication。请参见 https://kb.vmware.com/s/article/2106946

  • 无法加密活动复制中的未加密源虚拟机

    如果尝试加密活动复制配置中的未加密虚拟机,则加密会失败。 

    解决办法:恢复未加密的虚拟机,并使用加密的种子磁盘配置新复制。

    1.  恢复远程站点上的虚拟机,但不打开该虚拟机的电源。
    2.  移除源虚拟机的复制。
    3.  编辑目标站点上虚拟机的设置,并将虚拟机存储策略更改为虚拟机加密策略。
    4.  编辑源站点上源虚拟机的设置,并将虚拟机存储策略更改为虚拟机加密策略。
    5.取消注册目标站点上已恢复的虚拟机,但不删除磁盘。
    6.  配置新复制,并选择目标站点上已恢复虚拟机的磁盘作为种子。

  • 如果选择 Storage DRS 集群作为复制目标,则重新配置复制会失败

    如果您尝试重新配置复制,并将复制移至 Storage DRS 集群中的数据存储部分,则重新配置会失败。

    解决办法:移除该复制,并配置指向所需数据存储的新复制。

  • 无法通过 vSphere Replication 使用自定义用户和角色

    无法以自定义用户身份配置复制,即使该自定义用户已分配了两个站点上所需的所有 VRM 特权也是如此。“配置复制”向导中的“目标位置”页面上显示错误消息:执行此操作的权限已拒绝 (Permission to perform this operation is denied)

    解决办法:无。必须在两个站点上以 SSO 管理员用户身份执行所有 vSphere Replication 操作。

  • 恢复到之前的快照,然后重新恢复到最新快照时,启用了多个时间点实例的已恢复虚拟机可能会丢失附加到最新快照的磁盘

    恢复启用了时间点实例的虚拟机并为未解析的磁盘(如果有)附加磁盘时,这些磁盘将附加到最新快照。如果先恢复到之前的快照,然后再恢复到最新快照,附加的磁盘将不可用。

    解决办法:编辑虚拟机的设置并添加所需磁盘作为现有硬盘。

  • 无法配置具有物理模式 RDM 磁盘的虚拟机,即使从复制中排除该磁盘也是如此

    如果您为采用物理模式的虚拟机配置复制,可能看到以下错误:

    VRM 服务器一般错误。查看文档了解任何故障排除信息。 
    详细的异常为: HMS 无法为虚拟机的磁盘设置磁盘 UUID: MoRef:  
    type = VirtualMachine, value = 
       
          
           
        , serverGuid = null'。
       
          

    解决办法:无。

  • 使用 vSphere Replication 8.5 恢复虚拟机无法打开已恢复虚拟机的电源

    如果将已复制的虚拟机连接到分布式虚拟交换机,并尝试在自动化的 DRS 集群中执行恢复,则恢复操作将成功,但无法打开所生成虚拟机的电源。

    解决办法:编辑已恢复虚拟机的设置,以将其连接到正确的网络。

  • 注册其他 vSphere Replication 服务器需要花费较长时间

    如果 vCenter Server 管理上百台 ESXi Server 主机,则在 vSphere Replication 设备中注册其他 vSphere Replication 服务器可能需要花费几分钟。
    这是因为 vSphere Replication 服务器必须在每台 ESXi Server 主机上进行注册。

check-circle-line exclamation-circle-line close-line
Scroll to top icon