VMware vCenter Site Recovery Manager 5.5.1.x 发行说明

|

VMware vCenter Site Recovery Manager 5.5.1.7 | 2016 年 8 月 25 日 | 内部版本 4265224

VMware vCenter Site Recovery Manager 5.5.1.6 | 2016 年 2 月 24 日 | 内部版本 3572851

VMware vCenter Site Recovery Manager 5.5.1.5 | 2015 年 4 月 16 日 | 内部版本 2653439

VMware vCenter Site Recovery Manager 5.5.1.4 | 2014 年 10 月 22 日 | 内部版本 2215373

VMware vCenter Site Recovery Manager 5.5.1.3 | 2014 年 10 月 1 日 | 内部版本 2170717

VMware vCenter Site Recovery Manager 5.5.1.2 | 2014 年 7 月 30 日 | 内部版本 2000438

VMware vCenter Site Recovery Manager 5.5.1.1 | 2014 年 7 月 17 日 | 内部版本 1964818

VMware vCenter Site Recovery Manager 5.5.1 | 2014 年 3 月 11 日 | 内部版本 1647061

上次更新时间:2016 年 8 月 25 日

请查看发行说明以了解新增内容及更新。

有关 Site Recovery Manager 5.5.1.x 修补程序版本的信息,包括任何所需的 vSphere Replication 5.5.1.x 修补程序的详细信息,请参见相应知识库文章。

发行说明内容

本发行说明包含以下主题:

SRM 5.5.1 的新增功能

VMware vCenter Site Recovery Manager 5.5.1 增加了以下新功能和改进功能。

本地化

VMware vCenter Site Recovery Manager 5.5.1 提供以下语言版本:

  • 英语
  • 法语
  • 德语
  • 日语
  • 韩语
  • 简体中文

兼容性

没有与 vCenter Server 5.5u2 和 5.5u3 版本对应的 SRM 5.5.2 或 5.5.3 版本。SRM 5.5.1.x 已经过完全测试并完全支持 vCenter Server 5.5u1、5.5u2 和 5.5u3。

SRM 兼容性列表

有关互操作性和产品兼容性的信息(包括支持的客户机操作系统和客户机操作系统自定义支持),请参见《VMware vCenter Site Recovery Manager 5.5 兼容性列表》

兼容的存储阵列和存储复制适配器

有关受支持的兼容存储阵列和 SRA 的最新列表,请参见《Site Recovery Manager 存储合作伙伴兼容性指南》

VMware Virtual SAN 支持

SRM 5.5.1 可以使用 vSphere Replication 保护驻留在 VMware Virtual SAN 上的虚拟机。Virtual SAN 不需要存储复制适配器 (SRA) 即可与 SRM 5.5.1 配合使用。

VMware VSA 支持

SRM 5.5.1 可以使用 vSphere Replication 保护驻留在 vSphere Storage Appliance (VSA) 上的虚拟机。VSA 不需要存储复制适配器 (SRA) 即可与 SRM 5.5.1 配合使用。

安装和升级

有关帮助进行 Site Recovery Manager 5.5.1 的主要特性和功能的技术演练的评估指南,请参见 VMware vCenter Site Recovery Manager 资源

有关支持的 SRM 升级路径,请参见 VMware 产品互操作性列表并选择解决方案升级路径VMware vCenter Site Recovery Manager

安装 SRM 5.5.1

要进行 SRM 5.5.1 全新安装,请下载并运行安装程序 VMware-srm-5.5.1-1647061.exe

请参见《Site Recovery Manager 5.5 安装和配置》中的安装 SRM

请将现有 SRM 4.1.2 安装升级到 SRM 5.5.1

在升级到 SRM 5.5.1 之前,请先将 SRM 4.1.2 升级到 SRM 5.0.x。

请参见《Site Recovery Manager 5.0 管理指南》中的“升级 SRM”

重要信息:将 vCenter Server 直接从 4.1.2 升级到 5.5.1 是受支持的升级路径。但是,将 SRM 直接从 4.1.2 升级到 5.5.1 并非受支持的升级路径,您必须先升级到 SRM 5.0.x,然后才能升级到 5.5.1。如果升级包括 SRM 4.1.2 安装的 vCenter Server 4.1.2 实例,您还必须先将 vCenter Server 升级到版本 5.0.x,然后再将 SRM 升级到 5.0.x。如果将 vCenter Server 直接从 4.1.2 升级到 5.5.1,则尝试将 SRM 从 4.1.2 升级到 5.0.x 时,SRM 升级将会失败。SRM 5.0.x 无法与 vCenter Server 5.5 实例连接。

将现有 SRM 5.0.x 或 5.1.x 安装升级到 SRM 5.5.1

要将现有 SRM 5.0.x 或 5.1.x 安装升级到 SRM 5.5.1,请下载并运行安装程序 VMware-srm-5.5.1-1647061.exe

请参见《Site Recovery Manager 5.5 安装和配置》中的升级 SRM

升级包含使用 RDM 的虚拟机的站点

如果保护使用裸磁盘映射 (RDM) 的虚拟机,创建数据库表时,在恢复站点上将 Site Recovery Manager 5.0.x 或 5.1.x 升级到 Site Recovery Manager 5.5.1 会失败。升级失败并显示错误消息:无法创建数据库表。无法执行升级:未初始化 (Failed to create database tables. Could not perform the upgrade: Not initialized)。如果使用 RDM 且 Site Recovery Manager 环境处于以下某种状态,则尝试升级时会发生此问题:

  1. 执行了测试恢复,但在尝试升级之前未完成测试清理。
  2. 执行了恢复,但在尝试升级之前未执行重新保护。

要避免此问题,请在测试恢复后执行清理或在恢复后执行重新保护,然后再尝试升级。

解决办法:如果遇到此问题,可通过手动修改数据库表进行解决。注意:此解决办法取决于尝试升级失败之前是否备份了恢复站点上的数据库。

  1. 从尝试升级失败之前执行的备份还原恢复站点上的数据库。
  2. 连接到恢复站点上的数据库并删除 pds_rdmrecoveryinfo 表中的所有条目。
  3. 重新升级恢复站点上的 Site Recovery Manager Server。
    重要信息再次尝试升级之前,请勿备份数据库。请保留在初次升级尝试失败之前执行的原始备份。
  4. 升级完成后,停止 Site Recovery Manager 服务。
  5. 将备份数据库的 pds_rdmrecoveryinfo 表中的行插入到升级后的数据库的 pds_rdmrecoveryinfo 表中。
  6. 通过从 sequence_table 中选择 ID 来获取 unique_key,其中 name = 'global_sequence'
  7. 对于在步骤 5 中插入的 n 行中的每一行,按如下方式更新各列的值:
          recovereddeviceinfo       unique_key + n
          peerdevicegroup           ''
          peerdevicegrouphasvalue   0
  8. 对于在步骤 5 中插入的 n 行中的每一行,按如下方式在 pds_recovereddeviceinfo 表中创建一个新行:
          db_id                unique_key + n
          mo_id                ''
          ref_count            1
          device               (value of pds_rdmrecoveryinfo.device  n)
          peerdevice           ''
          peerdevicehasvalue   0
  9. 启动 Site Recovery Manager 服务。

将现有 SRM 5.5 安装更新至 SRM 5.5.1

执行以下步骤将现有 SRM 5.5 安装更新至 SRM 5.5.1。

  1. 登录到受保护站点上运行 SRM Server 的计算机。
  2. 使用数据库软件提供的工具备份 SRM 数据库。
  3. 下载并运行安装程序 VMware-srm-5.5.1-1647061.exe
  4. 当系统提示您确认要升级 SRM 时,单击
  5. 单击确认已备份 SRM 数据库。
  6. 安装完成后,请单击完成
  7. 在恢复站点上重复升级过程。

更新 SRM Server 之后,必须重新安装 SRM 客户端插件。

  1. 登录到运行 vSphere Client 实例(该实例用于连接到 SRM)的计算机。
  2. 卸载 SRM 5.5 客户端插件。
  3. 登录到 vSphere Client 实例并连接到与 SRM Server 连接的 vCenter Server。
  4. 选择插件 > 管理插件
  5. 单击下载并安装以安装 SRM 5.5.1 客户端插件。
  6. 插件安装完成后,登录到 SRM 并确认早期版本中的配置已保留。
  7. 对用于连接到 SRM Server 的所有 vSphere Client 实例重复此过程。

将 vSphere Replication 升级到 vSphere Replication 5.5.1

如果已安装的 vSphere Replication 带有以前版本的 SRM,要升级到 SRM 5.5.1,还必须将 vSphere Replication 升级到版本 5.5.1。还必须将 vSphere Replication 服务器升级到版本 5.5.1。必须确保在将 vSphere Replication 升级到版本 5.5.1 之前,已将 SRM 升级到版本 5.5.1 并且至少已将 vCenter Server 升级到版本 5.5。

重要信息:不支持 vSphere Update Manager 5.5u3。要升级 vSphere Replication,必须使用可下载 ISO,或 vSphere Replication 设备的虚拟设备管理界面 (VAMI)。

  • 要将 vSphere Replication 从版本 1.0.x 或 5.1.x 升级到 5.5.1,请使用 vSphere Replication 5.5.1 的可下载 ISO 文件。
    注意:如果从 vSphere Replication 1.0.3.3 或 5.1.3.1 进行升级,必须至少升级到版本 5.5.1.5。无法从 vSphere Replication 1.0.3.3 或 5.1.3.3 升级到 5.5.0.0 和 5.5.1.4 之间的 vSphere Replication 版本。
  • 要将 vSphere Replication 从版本 5.5 更新到 5.5.1,请使用 vSphere Replication 5.5.1 的可下载 ISO 文件、vSphere Update Manager 或 vSphere Replication 设备的虚拟设备管理界面 (VAMI)。
  • 要在更高的更新版本可用时将 vSphere Replication 从版本 5.5 更新到 5.5.1,请使用 vSphere Replication 5.5.1 的可下载 ISO 文件,或者将 VAMI 中的“使用指定存储库”选项设置为 https://vapp-updates.vmware.com/vai-catalog/valm/vmw/05d561bc-f3c8-4115-bd9d-22baf13f7178/5.5.1.0。
    注意:要获取 vSphere Replication 5.5.1.x 修补程序版本的 VAMI 升级 URL,请参见相应 Site Recovery Manager 5.5.1.x 修补程序版本的知识库文章。

请参见《Site Recovery Manager 安装和配置》中的升级 vSphere Replication

重要信息:请不要选择 VAMI 中更新 > 设置下的选项来自动更新 vSphere Replication。如果选择自动更新,则 VAMI 会将 vSphere Replication 更新至最新的 5.x 版本,而该版本可能与 SRM 和 vCenter Server 5.5.x 不兼容。请将更新设置继续设置为无自动更新

SRM 和 vSphere Replication 的操作限制

有关 SRM 5.5.x 和 vSphere Replication 5.5.x 的操作限制的信息,请参见 http://kb.vmware.com/kb/2034768

有关在共享恢复站点配置中使用 SRM 5.5.x 和 vSphere Replication 5.5.x 时的保护和恢复限制,请参见 http://kb.vmware.com/kb/2008061

SRM SDK

有关 SRM 基于 SOAP 的 API 的使用指南,请参见 VMware vCenter Site Recovery Manager API

开放源组件

可以从 VMware vCenter Site Recovery Manager 下载中获取适用于 Site Recovery Manager 5.5.1 中分发的开放源软件组件的版权声明和许可证。您还可以下载 vCenter Site Recovery Manager 最新通用版本的所有 GPL、LGPL 或者其他要求公开源代码或源代码修改的类似许可证的源文件。

局限声明和限制

  • SRM 5.5.1 为 vCloud Director 环境提供了有限的支持。不支持使用 SRM 保护 vCloud 资源池内的虚拟机(部署到一个组织的虚拟机)。支持使用 SRM 保护 vCD 的管理结构。有关如何使用 SRM 保护 vCD Server 实例、vCenter Server 实例以及提供 vCloud Director 管理基础架构的数据库的信息,请参见《VMware vCloud Director Infrastructure Resiliency 案例研究》
  • SRM Server 不支持 Windows Server 2003 平台,但 SRM 安装程序允许您在 Windows Server 2003 上安装 SRM。
  • 在恢复之后,将禁用虚拟机上的 vSphere Flash Read Cache 并将预留设置为零。在配置为使用 vSphere Flash Read Cache 的虚拟机上执行恢复之前,请通过 vSphere Web Client 记录虚拟机的缓存预留信息。这样可以在恢复之后重新配置虚拟机上的 vSphere Flash Read Cache。

已解决的问题

本版本中已解决以前版本中存在的以下问题。

  • 如果测试恢复计划时 SRM 意外停止,则 SRM 将在您尝试重新运行该测试时再次停止。

    测试恢复计划时 SRM 意外停止将导致 SRM 始终在您尝试重新运行该计划时停止。这是由于对因过早终止测试恢复而处于无效状态的虚拟机的状态执行断言检查导致的。该问题已解决。

  • 重新配置复制以包含先前排除的磁盘并对该磁盘使用复制种子时,会导致 vSphere Replication 错误地删除该复制种子。

    如果您有一个排除了磁盘的复制,后来重新配置该复制以包含排除的磁盘,然后手动复制磁盘文件以用作复制种子,vSphere Replication 会删除复制的 .vmdk 文件,而忽略该文件是初始副本,并非由 vSphere Replication 所创建这一事实。这种情况下,需要您再次将 .vmdk 文件复制到目标站点。该问题已解决。

  • 升级 SRM 和 vSphere Replication 之后无法取消配置复制或运行重新保护。

    如果运行了测试恢复但未执行清理,并且随后将 vSphere Replication 升级到版本 5.5,则无法取消配置复制或执行重新保护,并将显示错误:VRM 服务器一般错误...“提交事务时出现错误”(VRM Server generic error ...'Error committing the transaction')。发生此错误是因为在升级期间,vSphere Replication 无法清理 vSphere Replication 数据库中测试映像的数据,从而导致无法进一步移除复制。该问题已解决。

  • 在恢复或测试恢复期间 IP 自定义失败。

    运行恢复或恢复计划的测试恢复时,由于以下原因之一,部分或全部虚拟机的 IP 自定义失败:

    • 在某些更改了临时文件夹路径的 Windows 虚拟机上,IP 自定义在错误的位置查找结果日志。有关详细信息,请参见知识库文章 2021083。该问题已解决。
    • 如果在 Windows 虚拟机上执行 IP 自定义时无法访问中间结果日志,则自定义会成功完成,但会报告错误错误 - 无法完成自定义,可能是由于脚本运行时错误或脚本参数无效 (错误代码: -1)。可能已部分应用 IP 设置 (Error - Cannot complete customization, possibly due to a scripting runtime error or invalid script parameters (Error code: -1). IP settings may have been partially applied)。该问题已解决。IP 自定义现在正确报告成功。
  • SRM 无法挂载 VMFS 卷,并出现错误已挂载 (Already Mounted)

    当 SRM 从 vCenter Server 获取信息时,SRM 显示未挂载包含虚拟机的卷。但同时,ESXi Server 成功挂载该卷。SRM 根据先前来自 vCenter Server 的信息尝试挂载卷,并显示该卷的状态无效,但却说明已挂载该卷。该问题已解决。

  • 在 Windows Server 2012 上 SRM 安装导致出现 MsiExec 错误,可能失败,并出现以下错误错误: 无法打开服务: ProtectedStorage (ERROR: Could not open service: ProtectedStorage)

    SRM 安装程序尝试启动 Server 2012 上不存在的受保护存储服务。在大多数情况下,安装成功,但 Windows 事件日志会记录 MsiExec 错误。如果 Windows 错误报告设置为“I don't want to participate, and don't ask again”,SRM 安装会失败并回滚。该问题已解决。

  • 多次尝试连接到 vCenter Server 或 vSphere Replication 服务器时,vSphere Replication 管理服务器由于潜在的内存泄露问题而导致无响应。

    本版本已解决该问题。

  • 在测试恢复期间,SRM 服务在进行到连接 SCSI LUN 步骤时停止。

    运行恢复计划测试时,在执行连接 SCSI LUN 的步骤时,SRM 服务意外停止。恢复计划测试正确启动,并继续执行“创建可写存储快照”步骤,此时,测试计划不再继续进行。系统最后报告 SRM 服务不再可用。SRM 日志包含错误:Panic: Assert Failed: "_completions.find(tag) == _completions.end() (Operation added with duplicate tag)"。重新启动 SRM 服务后,恢复计划测试显示为不完整。重新运行测试将失败,只能选择执行清理。当 SCSI LUN 有重复的设备 ID 时(例如不同阵列上的两个 LUN 的 ID 相同),会出现此问题。该问题现已修复。

  • 通过 SRM API 调用故障切换将执行灾难恢复。

    在 SRM 5.0.x 和 5.1.x 中,如果通过使用 SRM API 来调用故障切换,SRM 将执行计划迁移。这与 API 文档所描述的不一致。在 SRM 5.5中,SRM 将执行灾难恢复,以确保 API 文档和实施保持一致性。此行为是正确行为。

  • 关闭部分虚拟机期间计划的迁移失败,因为这些虚拟机处于无效状态。

    某些虚拟机的计划迁移失败,并显示以下错误:错误 - 已从 [虚拟机] 收到 SOAP 响应故障: shutdownGuest 无法在当前状态 (已打开电源) 下执行尝试的操作 (Error - Received SOAP response fault from [virtual machine]: shutdownGuest The attempted operation cannot be performed in the current state (Powered on))。导致该错误的原因是 SRM 在仍然处于更改状态期间尝试关闭虚拟机。SRM 现在先尝试关闭虚拟机三次,然后再发送错误。如果仍然显示该错误,请再次运行恢复。

  • SRM Server 在执行重新保护强制恢复期间意外停止。

    在选中了强制恢复选项的情况下,如果在运行恢复后使用 vSphere Replication 并运行重新保护,SRM Server 会意外停止并显示以下错误:Panic: Assert Failed: "!peerHmsServerRef.IsNull()"。SRM Server 找不到远程 vSphere Replication 管理服务器。该问题已解决。

已知问题

下列已知问题是通过严格测试而发现的,可帮助您了解在此版本中可能遇到的某些行为。

  • 保护虚拟机任务似乎停留在 100%。

    在执行保护虚拟机任务期间,VI Client 的“近期任务”窗格会显示虚拟机停留在 100%。SRM 会将该虚拟机标记为已配置,表示该虚拟机已受保护。由于 SRM 已成功保护该虚拟机,因此不需要采取任何措施。

  • 如果数据存储名称包含特定字符,则数据存储浏览器不会显示数据存储文件夹。

    选择 vSphere Replication 的目标数据存储文件夹时,如果数据存储名称包含特定字符(如左右圆括号或空格),则数据存储浏览器窗口不会显示数据存储的子文件夹。

    解决办法:要选择包含圆括号字符或空格的数据存储的子文件夹,请在数据存储浏览器中选择数据存储,然后单击打开按钮。此操作将打开数据存储并显示数据存储文件夹。

  • 停止受保护虚拟机的数据存储复制会生成错误的错误消息

    可保护在多个数据存储上具有磁盘的虚拟机,随后禁用其中一个数据存储的复制。在这种情况下,保护组中虚拟机的状态将更改为无效: 虚拟机“VM”不再受保护。内部错误: 无法为磁盘“2001”创建定位符... (Invalid: Virtual machine 'VM' is no longer protected. Internal error: Cannot create locator for disk'2001'...)此信息错误。状态应更改为不再复制数据存储“[datastore name]”(Datastore '[datastore name]' is no longer replicated)

  • 恢复 vSphere Replication 保护组失败,并显示错误:指定的密钥、名称或标识符已经存在 (The specified key, name, or identifier already exists)

    如果在配置占位虚拟机和为该虚拟机配置 vSphere Replication 时选择了相同的数据存储,占位虚拟机文件和恢复的虚拟机文件可能位于相同路径中。这会导致恢复期间出错。

    解决办法:为占位虚拟机和 vSphere Replication 选择不同的数据存储。

  • 无法配置具有物理模式 RDM 磁盘的虚拟机,即使从复制中排除该磁盘也是如此。

    如果您在采用物理模式 RDM 磁盘的虚拟机上配置 vSphere Replication,可能看到以下错误消息:

    VRM 服务器一般错误。查看文档了解任何故障排除信息。详细的异常为: HMS 无法为虚拟机的磁盘设置磁盘 UUID: MoRef: 类型 = VirtualMachine,值 = ,serverGuid = null' (VRM Server generic error. Check the documentation for any troubleshooting information. The detailed exception is: HMS can not set disk UUID for disks of VM : MoRef: type = VirtualMachine, value = , serverGuid = null')。

    解决办法:无。无法在包含物理模式 RDM 磁盘的虚拟机上配置 vSphere Replication。

  • 虚拟设备管理界面 (VAMI) 不接受非 ASCII 密码

    使用密码为非 ASCII 字符的帐户尝试登录 VAMI 会失败。即使提供正确的身份验证信息,也会出现这种情况。在非 ASCII 密码与 VAMI 一起使用的所有情况下,都会出现该问题。要避免出现此问题,请使用 ASCII 密码或者使用 SSH 进行连接。

  • 重新保护失败,并出现错误消息:远程主机已断开连接,无法与之进行通信 (Unable to communicate with the remote host, since it is disconnected)

    出现此错误的原因可能是,受保护端的群集已配置为使用 Distributed Power Management (DPM),并且该操作所需的 ESX 主机之一已置于待机模式。如果 DPM 检测到主机已闲置并将其置于待机模式,则可能发生这种情况。SRM 必须与该主机进行通信,才能访问该主机所管理的已复制数据存储。SRM 不会管理受保护站点的 DPM 状况,但是,它会管理在恢复站点执行恢复、测试和清理期间的 DPM 状况。

    解决办法:如果该错误仍然存在,请暂时关闭 DPM 并确保已打开管理受保护端的已复制数据存储的 ESX 主机,然后再尝试运行重新保护。

  • 在启用了 Distributed Power Management (DPM) 的群集上卸载数据存储失败

    如果连接到 DPM 群集的主机进入待机模式,则计划的迁移和灾难恢复无法从主机中卸载数据存储。可能会显示以下错误消息:错误: 无法从主机 hostname 卸载数据存储 datastorename。远程主机已断开连接,无法进行通信 (Error: Cannot unmount datastore datastorename from host hostname. Unable to communicate with the remote host, since it is disconnected)。要解决此问题,请在完成计划的迁移或灾难恢复之前关闭受保护站点中的 DPM。可以选择在完成恢复任务后重新打开 DPM。

  • 在尝试使用 vSphere Replication 来保护已受到重新保护的基于阵列的虚拟机时,SRM 将停止。

    如果您运行恢复,并尝试使用 vSphere Replication 来保护已受基于阵列的保护组保护的虚拟机,则 SRM Server 会停止。

    解决办法:重新启动 SRM Server,并在使用 vSphere Replication 进行保护之前先取消保护基于阵列的受保护虚拟机。或者,也可以继续进行基于阵列的保护,而不使用 vSphere Replication 进行保护。SRM 不支持同时使用这两种提供程序来执行保护。

  • 如果在维护模式下重新启动恢复站点 ESXi 主机后 10 分钟内尝试清理,则清理会失败。

    该清理操作将尝试交换占位符,并使用主机弹性缓存,该缓存的刷新时段为 10 分钟。如果您对已在这 10 分钟内重新启动的 ESXi 主机执行交换操作,则 SRM 不会更新 SRM 主机弹性缓存中的信息,并且该交换操作将失败。该清理操作也会失败。

    解决办法:请等待 10 分钟,然后再尝试清理。

  • 由于磁盘配置错误,虚拟机恢复失败

    可以将单个受保护虚拟机的不同的磁盘和配置文件置于多个数据存储中。恢复期间,SRM 必须有权访问裸磁盘映射和父磁盘文件。如果不具有此访问权限,则 SRM 无法在恢复期间确定磁盘类型。在这种情况下,SRM 可能会假定裸磁盘映射 (RDM) 磁盘是非 RDM 磁盘,从而导致重新配置失败。要避免出现此问题,请确保所有可访问已恢复虚拟机配置文件的主机也可以访问 RDM 映射文件及任何父磁盘(如果这类磁盘存在)。

  • 重新运行重新保护失败,并出现错误消息:保护组“{protectionGroupName}”已通过需要修复的占位保护虚拟机 (Protection Group '{protectionGroupName}' has protected VMs with placeholders which need to be repaired)。

    如果 ReloadFromPath 操作在第一次重新保护期间没有成功,则相应的受保护虚拟机将进入 repairNeeded 状态。当 SRM 对保护组运行重新保护时,SRM 既无法修复受保护的虚拟机,又无法还原占位虚拟机。如果由于相应的 ReloadFromPath 操作失败而使首次对虚拟机执行重新保护操作失败,则会出现该错误。

    解决办法:启用强制清理选项并重新运行重新保护。此选项将完成重新保护操作,并启用重新创建占位选项。单击重新创建占位以修复此受保护虚拟机并还原占位虚拟机。

  • 连接受保护站点失败后,恢复无法继续

    如果在取消激活操作期间或者在 RemoteOnlineSync 或 RemotePostReprotectCleanup 期间无法访问保护站点(在重新保护期间会同时出现这两种情况),则恢复计划可能无法继续。在这种情况下,系统会等待属于保护站点的虚拟机或组完成这些中断的任务。如果在执行重新保护操作期间出现该问题,则必须重新连接原始保护站点,然后取消并重新启动恢复计划。如果在恢复期间出现该问题,则取消并重新启动恢复计划即可。

  • vSphere Replication 设备无法支持有效的 ESX 主机

    在配置 vSphere Replication 的过程中,在受支持的 ESX 版本上选择数据存储时,会显示以下消息:VR 服务器 Server Name 不具有可用于访问目标数据存储的主机... (VR server Server Name has no hosts through which to access destination datastore...)。向 vCenter Server 中添加新主机时或注册 vSphere Replication 服务器期间,如果 vSphere Replication 设备与 vSphere Replication 服务器之间的通信暂时中断,则将发生此问题。通信问题通常是由连接暂时中断或服务器服务停止引起的。

    要解决此问题,请重新启动 vSphere Replication 管理服务器服务。

    1. 登录到 vSphere Replication 设备的虚拟设备管理界面 (VAMI),地址为 https://vr_applliance_address:5480。
    2. 单击服务状态下的 配置 > 重新启动

  • 恢复的 VMFS 卷无法挂载,并出现错误消息:无法恢复数据存储 (Failed to recover datastore)

    出现该错误的原因可能是 vCenter、ESXi 和 SRM Server 之间出现滞后时间。

    解决办法:重新运行恢复计划。

  • 在某些情况下,当保护站点 LUN 遇到全部路径异常 (APD) 或永久设备丢失 (PDL) 时,SRM 可能无法恢复裸磁盘映射 (RDM) LUN。

    在首次尝试计划的迁移时,如果 SRM 尝试关闭受保护的虚拟机,则可能会显示以下错误消息:

    错误 - 当前不允许该操作,因为虚拟机中存在未决问题: 'msg.hbacommon.askonpermanentdeviceloss: 为虚拟磁盘 VM1-1.vmdk 提供支持的存储永久丢失了设备。您可以在单击“重试”后从虚拟机热移除此虚拟设备并继续。单击“取消”终止此会话 (Error - The operation cannot be allowed at the current time because the virtual machine has a question pending: 'msg.hbacommon.askonpermanentdeviceloss:The storage backing virtual disk VM1-1.vmdk has permanent device loss. You might be able to hot remove this virtual device from the virtual machine and continue after clicking Retry. Click Cancel to terminate this session)。

    在某些情况下,如果受保护虚拟机具有 RDM 设备,则 SRM 不会恢复 RDM LUN。

    解决办法:

    1. 当 LUN 进入 APD/PDL 状态后,ESXi Server 会使用一个问题来标记所有相应虚拟机,而该问题可能会阻止虚拟机操作。
      1. 如果出现 PDL,请单击取消关闭虚拟机电源。
      2. 如果出现 APD,请单击重试

      如果您运行计划的迁移,SRM 将无法关闭生产虚拟机的电源。
    2. 如果虚拟机具有 RDM 设备,则 SRM 可能无法跟踪 RDM 设备,并且不会对其进行恢复。重新扫描所有 HBA,并确保所有受影响的 LUN 的状态均已从 APD/PDL 状况中恢复。
    3. 检查 vCenter Server 清单并解决阻止虚拟机的 PDL 问题。
    4. 如果在 LUN 恢复联机前解决 PDL 问题,则受保护站点上的 SRM Server 会错误地检测到 RDM 设备已不再附加到此虚拟机,并会移除此 RDM 设备。下次运行恢复时,SRM 将不会恢复该 LUN。
    5. 重新扫描所有 HBA 以确保 vCenter Server 清单上的所有 LUN 均处于联机状态,并打开所有受影响虚拟机的电源。vCenter Server 会将丢失的 RDM 与受保护虚拟机相关联。
    6. 检查 SRM 界面上的阵列管理器选项卡。如果所有受保护的数据存储和 RDM 设备均未显示,请单击刷新以发现设备并重新计算数据存储组。
    7. 确保编辑组设置显示所有受保护的数据存储和 RDM 设备,并且虚拟机保护状态未显示任何错误。
    8. 启动一个计划的迁移来恢复所有受保护的 LUN,包括 RDM 设备。

  • 重新保护虚拟机时,在执行“将保护配置为反向”步骤时可能会出现以下错误: 错误 - 保护组“pg_name”的该操作仅部分完成,因为保护组中某个受保护虚拟机未成功完成操作。VR 未复制虚拟机“vm_name”(Error - The operation was only partially completed for the protection group 'pg_name' since a protected VM belonging to it was not successful in completing the operation. VM 'vm_name' is not replicated by VR)。

    如果在执行“将存储配置为反向”步骤期间第一次运行重新保护失败并出现操作已超时 (Operation Timed out) 错误,则在第二次运行重新保护时会出现上述错误。

    解决办法:手动为受影响的虚拟机配置反向复制,然后重新运行重新保护。有关反向复制的信息,请参见 vSphere Replication 管理在 vSphere Replication 中对虚拟机进行故障恢复

  • vCenter Server 连接临时中断可能会导致具有裸磁盘映射的虚拟机出现恢复问题

    如果在恢复过程中与 vCenter Server 的连接中断,则可能会出现以下状况之一:

    • vCenter Server 仍不可用,恢复失败。要解决此问题,请重新建立与 vCenter Server 的连接并重新运行恢复。
    • 在极少数情况下,vCenter Server 可以再次使用且恢复虚拟机。在这种情况下,如果虚拟机具有裸磁盘映射 (RDM),则可能无法正确映射 RDM。由于无法正确映射 RDM,因此可能无法打开虚拟机电源,或者出现与客户机操作系统或在该客户机操作系统上运行的应用程序相关的错误。
      • 如果这是测试恢复,请完成清理操作并再次运行测试。
      • 如果这是实际恢复,则必须手动将正确的 RDM 附加到已恢复的虚拟机。

    有关添加裸磁盘映射的详细信息,请参见关于编辑虚拟机设置的 vSphere 文档。

  • 取消恢复计划未完成

    运行恢复计划时,会尝试同步虚拟机。可以取消恢复计划,但在同步完成或过期之前,无法完成尝试取消所运行的恢复计划的操作。默认过期时间为 60 分钟。以下选项可用于完成取消恢复计划:

    • 暂停 vSphere Replication,同步也将失败。恢复进入错误状况后,使用 vSphere Client 在“vSphere Replication”选项卡中重新启动 vSphere Replication。重新启动复制后,如果需要,可以再次运行恢复计划。
    • 等待同步完成或超时。这可能需要相当长的时间,但最终会完成。同步完成或过期之后,会继续取消恢复计划。

  • 关闭受保护虚拟机时恢复计划出错:错误 - 操作已超时: 900 秒,在“关闭受保护站点中的虚拟机”步骤期间 (Error - Operation timed out: 900 seconds during Shutdown VMs at Protected Site step)

    如果在支持动态交换的阵列(如 Clariion)上使用 SRM 保护数据存储,则在受保护站点部分关闭后运行灾难恢复时或运行强制恢复计划时,重新运行该恢复计划以完成受保护站点操作可能会出现错误。在受保护站点恢复联机但 SRM 无法关闭受保护的虚拟机时,会出现上述错误。通常,当某些阵列将受保护 LUN 设置为只读,从而使 ESXi 无法完成已打开电源的受保护虚拟机的 I/O 时,会出现该错误。

    解决办法:重新引导受保护站点上受只读 LUN 影响的 ESXi 主机。

  • 计划的迁移失败,并出现"错误: 无法复制配置文件... "(Error: Unable to copy the configuration file...)

    如果在群集中有两个 ESXi 主机,并且其中一个主机与存储断开连接,则另一个主机通常可以恢复已复制的虚拟机。在某些情况下,另一个主机可能无法恢复虚拟机,恢复失败并出现以下错误:错误: 无法复制配置文件... (Error: Unable to copy the configuration file...)

    解决办法:重新运行恢复。

  • 如果某一快照是在暂停复制后创建的,则在恢复到该快照后复制将会停止。

    在为虚拟机配置复制并暂停复制时,请创建快照,然后恢复复制并恢复到快照,而不是进入暂停状态,UI 中的复制状态不会更改,而且进度也不会发生变化。

    解决办法:暂停后恢复复制。

  • 在 vSphere Replication 上的操作有时会失败,并显示读取已超时错误消息。

    在 vSphere Replication 上的操作有时会失败,并会显示根本原因错误消息:java.net.SocketTimeoutException: 读取已超时 (java.net.SocketTimeoutException: Read timed out)。如果 ESXi Server 主机运行较慢,或者在 vSphere Replication 正在配置、重新配置、停止或撤消复制时运行其他操作(如 Storage vMotion),则会出现此错误。撤消复制时将遇到以下错误消息:无法撤消复制虚拟机 virtual_machine。VRM 服务器一般错误。请查看文档了解任何故障排除信息。详细的异常为: “java.net.SocketTimeoutException: 读取已超时”(Unable to reverse replication for the virtual machine virtual_machine. VRM Server generic error. Please check the documentation for any troubleshooting information. The detailed exception is: 'java.net.SocketTimeoutException: Read timed out')

    解决办法:在 ESXi Server 上的其他操作完成后重新运行该操作。

  • vSphere Replication 操作失败,并显示“未进行身份验证 (Not Authenticated)”错误。

    如果在一个 SRM 站点上启动操作(例如,在虚拟机上配置 vSphere Replication),然后在另一个站点上重新启动 vCenter Server 和 vSphere Replication 设备,则 vSphere Replication 操作将会失败,并显示错误:VRM 服务器一般错误。请查看文档了解任何故障排除信息。详细的异常为: “com.vmware.vim.binding.vim.fault.NotAuthenticated”(VRM Server generic error. Please check the documentation for any troubleshooting information. The detailed exception is: 'com.vmware.vim.binding.vim.fault.NotAuthenticated')。出现此问题是因为在重新启动 vCenter Server 和 vSphere Replication 设备之前,vSphere Replication 服务器在缓存中保留了连接会话。

    解决办法:从 SRM 客户端或 vSphere Web Client 注销后重新登录可以清除 vSphere Replication 连接缓存。

  • 在 ESXi 主机进入和退出维护模式后,清理测试恢复失败。

    如果在恢复站点上的 ESXi 主机处于维护模式时执行测试恢复,测试恢复将失败,这是预期行为。如果将 ESXi 主机退出维护模式并执行清理,则清理将失败,并显示主机仍处于维护模式的错误消息。

    解决办法:在将主机退出维护模式之后,等待约 10 分钟,然后再运行清理。或者,在将主机退出维护模式之后,运行清理之前,重新启动 SRM Server。

  • 无法在域控制器上安装 vSphere Client。

    在先前的版本中,可以将 vSphere Client 安装在用作 Active Directory 域控制器的主机上。在 vSphere 5.5中,如果 vSphere 安装程序检测到 Active Directory 服务,它将不允许安装 vSphere Client。

    解决办法:在安装 Active Directory 服务角色或将服务器升级为 Active Directory 域控制器之前安装 vSphere Client。

  • 受保护站点上的 SRM Server 在执行重新保护操作期间异常停止。

    如果您在成功执行计划的迁移后立即启动重新保护操作,受保护站点上的 SRM Server 可能会意外停止。导致该问题的原因是执行计划的迁移后发现存储阵列上复制的设备的列表时出现延迟。如果遇到该问题,日志中将显示以下错误:

    Error - Failed to reverse replication for failed over devices.SRA command 'prepareReverseReplication' failed.Address of the storage array is not reachable.Storage array might be down or IP address entered might be incorrect.Ensure that the storage array is up and running and the IP address of the storage array is reachable through the command line interface.

    解决办法:在执行恢复操作后等待大约 10 分钟,然后再执行重新保护操作。

  • vSphere Replication 服务器注册过程可能需要很长时间,具体取决于 vCenter Server 清单中的主机数量。

    如果 vCenter Server 清单包含上百台主机,则注册 VR 服务器任务将需要 10 至 20 分钟才能完成,因为 vSphere Replication 需要更新每台主机的 SSL 指纹注册表。

    解决办法:等待注册任务完成。完成后,您可以使用 vSphere Replication 处理入站复制流量。另请参见 vSphere Replication 服务器注册需要几分钟时间

  • 使用 ESXi Server 5.0 时,在具有快照的已恢复虚拟机上运行重新保护将失败,并显示数据存储已锁定错误。

    如果恢复使用 vSphere Replication 保护的虚拟机,并且该虚拟机具有快照,则在恢复后运行重新保护将导致数据存储已锁定错误。该错误仅在以下情况下发生:在运行 ESXi Server 5.0,并且没有选择在恢复时保留多个时间点 (MPIT) 快照的高级设置。

    解决办法:从已恢复虚拟机中移除复制,然后重新配置 vSphere Replication。随后便可以执行重新保护。

  • 运行恢复计划时在配置存储步骤中失败,并显示虚拟机错误。

    为同一虚拟机运行后续恢复计划时会在同一配置存储步骤失败,并显示错误消息:指定的密钥、名称或标识符已经存在 (The specified key, name, or identifier already exists)。如果您查看 vCenter Server 清单,将看到两台与故障虚拟机同名的虚拟机,其中一台在“Discovered Virtual Machines”文件夹内。此问题由 vCenter Server 和 ESXi Server 实例之间的已知通信问题导致。

    解决办法:从 vCenter Server 取消注册“Discovered Virtual Machines”文件夹中的重复虚拟机。对所有受影响的虚拟机完成此操作之后,重新运行恢复计划。

  • 在运行清理后马上执行测试恢复会导致错误。

    如果在上一次测试恢复后执行了清理,然后马上再执行测试恢复,此恢复会失败,并显示错误消息:文件已存在(File already exists)。这通常在通过自动化代码而非通过 SRM 界面运行测试恢复时发生。

    解决办法:等待几分钟,然后重试该操作。

  • 在链接模式下运行多个 vCenter Server 实例会导致显示重复的 SRM 角色

    如果在受保护站点和恢复站点上将 vCenter Server 实例配置为以链接模式运行,“分配权限”窗口将显示重复的 SRM 角色。

    解决办法:编辑每个 vCenter Server 实例中的 SRM 角色,为其提供唯一名称。

  • 配置保护失败并显示占位虚拟机创建错误

    在大量虚拟机上同时配置保护时失败,并显示占位虚拟机创建超时错误或占位虚拟机创建命名错误:

    • 占位虚拟机创建错误: 操作已超时: 300 秒 (Placeholder VM creation error:Operation timed out:300 seconds)
    • 占位虚拟机创建错误: 名称“placeholder_name”已存在 (Placeholder VM creation error:The name 'placeholder_name' already exists)

    解决办法:请参见《SRM 5.5 管理》中的配置保护失败并显示占位虚拟机创建错误

  • 在共享恢复站点配置中,操作将会失败并显示以下错误:与远程服务器的连接已断开 (The connection to the remote server is down)

    如果 vSphere Replication 服务器负载较重,则在共享恢复站点配置中执行的测试恢复、恢复和重新保护操作将会失败。

    解决办法:请勿在 200 个以上的虚拟机上执行并发操作,每个受保护站点的最大数量为 20 个虚拟机。

  • 在复制多个虚拟机期间,vSphere Replication 服务器可能进入不接受更多的 VRMS 连接但继续复制虚拟机的状态。

    解决办法:重新引导 vSphere Replication 服务器。

  • 将多个复制从一个 vSphere Replication 服务器移至另一个服务器会导致出错。

    vSphere Replication 重新配置或移动操作将失败,并显示错误 SocketTimeoutException: 读取已超时 (SocketTimeoutException: Read timed out),并且复制进入“错误”状态。当源 vSphere Replication 或目标 vSphere Replication 服务器和存储负载较重时,移动复制将超过几分钟并可能导致超时错误。

    解决办法:在新 vSphere Replication 服务器上重新配置复制。

  • 打开虚拟机的电源时,对具有 RDM 的虚拟机进行测试恢复将在“配置存储”步骤失败。

    测试恢复将在以下情况下失败:

    • 具有 RDM 的虚拟机在主站点上受保护。
    • 在“站点”>“资源映射”中,包含虚拟机的受保护站点资源将映射到 vApp 作为辅助站点资源。

    解决办法:将虚拟机映射到辅助站点上不属于 vApp 的资源类型上(例如主机)。

  • 测试清理操作失败,并出现数据存储卸载错误。

    执行测试恢复之后运行清理操作可能会失败,并出现错误:错误 - 无法从主机“hostname”卸载数据存储“datastore_name”。当前状态下不允许执行该操作 (Error - Cannot unmount datastore 'datastore_name' from host 'hostname'. The operation is not allowed in the current state)))。如果在运行清理操作之前,该主机已卸载该数据存储,则会出现此问题。

    解决办法:重新运行清理操作。

  • 计划的迁移在 vSphere vMotion 过程中失败,并在“关闭受保护站点中的虚拟机”步骤中显示错误。

    在计划的迁移过程中,当“关闭受保护站点中的虚拟机”步骤启动时,如果受保护虚拟机的 vSphere vMotion 正在进行中,则该步骤可能会失败,并显示错误:错误 - 无法在当前状态 (已打开电源) 下执行尝试的操作 (Error - The attempted operation cannot be performed in the current state (powered on))。出现此错误是因为在虚拟机迁移过程中 hostd 的关机和关闭电源操作失败。该问题已解决。

  • 虚拟机虚拟网卡的 MAC 地址在恢复过程中通常会保留。

    在极少数情况下,测试或恢复可能无法恢复某一特定虚拟机,因为 vCenter 会在恢复站点上为该虚拟机的虚拟网卡意外地分配一个新的 MAC 地址。恢复步骤的结果列将出现以下错误消息:错误 - 可能由于脚本运行时错误或脚本参数无效,无法完成自定义 (错误代码: 255)。可能已部分应用 IP 设置 (Error - Cannot complete customization, possibly due to a scripting runtime error or invalid script parameters (Error code: 255). IP settings might have been partially applied)。SRM 日志包含一条消息:Error finding the specified NIC for MAC address = xx::xx:xx:xx:xx,其中 xx::xx:xx:xx:xx 是预期的 MAC 地址。

    解决办法:在 vSphere Client 虚拟机的“属性”中,手动将受影响虚拟机的 MAC 地址修改为“xx::xx:xx:xx:xx”,然后重新启动恢复计划。

  • 繁体中文操作系统中事件显示错误

    vSphere Client 启动时,会确定运行时所用的区域设置,然后根据区域设置选择要显示的消息集。在繁体中文操作系统中安装 vSphere Client 时,客户端会从 vCenter Server 安装的 zh_TW 文件夹请求消息,因为 vCenter Server 和 vSphere Client 已本地化为繁体中文。尽管 vCenter Server 和 vSphere Client 已本地化为繁体中文,但 SRM 尚未本地化。因此,会显示 XXX 消息,而不是 SRM Server 消息。

    解决办法:

    1. 创建 en 文件夹的副本,该文件夹位于 C:\Program Files\VMware\Infrastructure\VirtualCenter Server\extensions\com.vmware.vcDr\locale\ 下。
    2. 将该文件夹从 en 重命名为 zh_TW
    3. 重新启动 vCenter Server 和 SRM 服务。
  • 由于在通过 VIX API 将自定义脚本上载至虚拟机时发生超时,IP 自定义失败。

    运行恢复计划时,使用 VIX 将 IP 自定义脚本上载到虚拟机失败,并发生超时。

    解决办法:无。

  • 如果升级到 SRM 5.5.1 而未升级 SRA,则在运行测试清理时,SRM Server 会意外停止。

    如果使用基于阵列的复制,并将 SRM 升级到版本 5.5.1,但不升级 SRA,SRM Server 会在您运行测试清理时意外停止。

    解决办法:将 SRA 升级到 5.5.1 的相应版本。

  • 按 CPU 许可证计数错误

    购买了 SRM 1.x 和 SRM 4.0 的某些客户可能仍在使用按 CPU 分配的许可证,而不是按虚拟机许可证。将获得授权的按 CPU 许可证的数量可能会少于 SRM 5.5 所需的数量。

    解决办法:无。

  • 将虚拟机复制重新配置到虚拟机的原始占位文件夹后重新保护失败。

    如果您从虚拟机中删除了已包含在保护组和恢复计划中的 vSphere Replication,则在虚拟机上重新配置复制,并使用指定目标文件夹选择虚拟机的原始占位数据存储文件夹时,恢复成功,但重新保护失败,并显示以下错误:错误: 无法撤消复制虚拟机“virtual_machine”,未找到具有 UUID 的复制磁盘的已恢复磁盘 (Error: Unable to reverse replication for the VM 'virtual_machine', A recovered disk was not found for replicated disk with UUID)

    解决办法:如果您在已包含在 SRM 保护组中的虚拟机上重新配置了 vSphere Replication,请重新创建保护组。配置复制时,请勿使用指定目标文件夹

  • 对高可用性 (HA) 群集中的 Virtual SAN 虚拟机执行 X-vMotion 操作可能会导致发出警报。

    对 HA 群集中的 Virtual SAN 虚拟机执行 X-vMotion 操作,将其迁移至其他群集和其他存储时,虚拟机会报告类似于以下内容的警报:vSphere HA 虚拟机故障切换失败 (vSphere HA virtual machine failover failed)

    解决办法:无。