无论是使用基准还是单个映像管理 vSAN 集群,修复属于 vSAN 集群的主机都有相应的细节。

修复 vSAN 集群中的主机时,必须注意以下行为:
  • vSphere Lifecycle Manager 一次仅将一个主机置于维护模式。
  • vSphere Lifecycle Manager 按顺序修复属于 vSAN 集群的主机。
  • 由于 vSphere Lifecycle Manager 按顺序处理主机的修复,因此主机修复过程可能需要很长时间才能完成。
  • vSphere Lifecycle Manager 修复配置了故障域的 vSAN 集群时,先升级一个故障域中的所有主机,然后再升级下一个故障域中的主机。
  • 对于 vSAN 延伸集群,vSphere Lifecycle Manager 先修复首选站点中的主机,然后再继续修复辅助站点中的主机。

主机维护模式和 vSAN 集群

可以通过两种方式修复 vSAN 集群中的主机,具体取决于您希望如何处理主机上的虚拟机:

  • 可以手动将主机置于维护模式,并使用 vSphere Lifecycle Manager 修复主机。
  • 可在 vSphere Lifecycle Manager 修复过程中使主机进入维护模式。

vSphere Client 中,将 vSAN 集群中的主机置于维护模式时,可以在多个选项之间进行选择:确保可访问性、撤出全部数据和不撤出数据。“确保可访问性”选项是默认选项,此选项意味着当您将主机置于维护模式时,vSAN 将确保主机上所有可访问的虚拟机保持可访问状态。有关各个选项的详细信息,请参见《vSphere 存储》文档中的“将 vSAN 集群的成员置于维护模式”主题。

在修复期间, vSphere Lifecycle Manager 会将 vSAN 集群中的主机置于维护模式,并以默认“确保可访问性”选项的相同方式处理主机上的虚拟机。

如果主机属于 vSAN 集群,并且主机上有任何虚拟机在其存储策略中使用“允许的故障数=0”设置,则在进入维护模式时,主机可能会出现异常延迟。发生延迟的原因是 vSAN 必须将虚拟机数据从 vSAN 数据存储集群中的一个磁盘迁移到另一个磁盘。可能会延迟数小时。可以通过将虚拟机存储策略设置为“允许的故障数=1”来解决此问题,这会导致在 vSAN 数据存储中创建两个虚拟机文件副本。

vSAN 运行状况检查

vSphere Lifecycle Manager 将对 vSAN 集群执行修复预检查,以确保修复成功。vSAN 运行状况检查是修复预检查的一部分。

vSAN 运行状况检查可提供有关集群状态的信息,并会指明是否必须执行额外操作以确保修复成功。即使未采用建议的操作,您仍然可以修复 vSAN 集群或集群中的主机。vSphere Lifecycle Manager 可成功将主机置于维护模式并在主机上成功应用软件更新。但是,主机可能无法退出维护模式,且修复过程可能会失败。因此,vSAN 集群中的主机升级了,但您必须执行手动步骤,使主机退出维护模式。

使用 vSphere Lifecycle Manager 映像修复 vSAN 延伸集群

管理 vSAN 延伸集群或具有 vSphere Lifecycle Manager 的双节点 ROBO 集群时,可以使用与升级专用见证主机所使用的映像不同的单个映像管理集群中的主机。在 vSphere 8.0 Update 2 中,升级 vSAN 见证主机的方式与升级独立主机相同。

什么是延伸集群

延伸集群是一种部署模型,在这种模型中,两个或多个主机属于同一个逻辑集群,但位于不同的地理位置。每个 vSAN 延伸集群或双节点 ROBO 集群都有一个见证主机,此见证主机是不属于相应集群但与其相关联的独立主机。vSAN 集群的见证主机由相应延伸集群或 ROBO 集群所在的同一 vCenter Server 管理。

vSphere Lifecycle ManagervSAN 见证主机

vSAN 见证主机是物理或虚拟 ESXi 主机,其中包含存储在 vSAN 集群中的虚拟机对象的见证组件。见证主机不支持工作负载,并且不是数据节点。单个延伸或双节点 ROBO 集群只能有一个见证主机。

您可以使用 vSphere Lifecycle Manager 映像来管理 vSAN 延伸集群及其见证主机。从 vSphere 8.0 Update 2 开始,可以为 vSAN 集群和见证主机定义单独的映像。存在以下要求:
  • vCenter Server 必须为版本 8.0 Update 2 及更高版本。
  • 见证主机必须为 ESXi 版本 7.0 Update 2 及更高版本。
  • 见证主机可以是虚拟服务器或物理服务器。
  • 见证主机可以是专用见证主机或共享见证主机。
  • 必须先升级见证主机,然后才能升级关联的 vSAN 延伸集群或双节点集群中的主机。
  • 见证主机和关联的 vSAN 集群不得并行升级。
  • 无法在见证主机上运行虚拟机。如果 vSphere Lifecycle Manager 检测到在见证主机上运行的任何失效虚拟机,则在修复独立主机期间,vSphere Lifecycle Manager 会将虚拟机电源状况修复设置设置为请勿更改电源状况。有关详细信息,请参见为使用单个映像管理的集群或独立主机配置 vSphere Lifecycle Manager 修复设置
可以通过执行以下任一任务,开始使用 vSphere Lifecycle Manager 映像管理见证主机:
  • 对于现有 vSAN 延伸集群或双节点 ROBO 集群以及对于专用独立主机,从使用 vSphere Lifecycle Manager 基准切换为使用 vSphere Lifecycle Manager 映像。
    注: 如果见证主机的 ESXi 版本低于 7.0 Update 2,不会阻止转换为使用映像。但是,在这种情况下,转换后,可以对集群使用单个 vSphere Lifecycle Manager 映像,但仍必须对见证主机使用 vSphere Lifecycle Manager 基准。在这种情况下,可以使用基准将见证主机升级到版本 7.0 Update 2 或更高版本,然后便可开始使用单个 vSphere Lifecycle Manager 映像来管理见证主机。
  • 将使用单个映像的现有 vSAN 集群转换为具有虚拟见证主机的延伸集群。
  • 对于 vCenter Server,升级到版本 8.0 Update 2 及更高版本,对于见证主机,升级到版本 7.0 Update 2 或更高版本。
在以下情况下,会停止使用 vSphere Lifecycle Manager 映像管理见证主机:
  • 将使用映像的现有 vSAN 延伸集群转换为常规 vSAN 集群。
  • 对使用单个映像管理的现有 vSAN 延伸集群停用 vSAN
重要说明: 在 vSphere 8.0 中,可以使用 vSphere Lifecycle Manager 映像来管理 vCenter Server 清单中的独立主机。从 vSphere 8.0 Update 2 开始,可以将单独的 vSphere Lifecycle Manager 映像应用于 vSAN 集群的见证主机。可以在将主机添加到清单时开始使用 vSphere Lifecycle Manager 映像管理见证主机,也可以将使用单个映像的现有独立主机转换为见证主机。

使用 vSphere Lifecycle Manager 映像升级 vSAN 延伸集群

对于延伸 vSAN 集群,必须先使用您配置的单独 vSphere Lifecycle Manager 映像升级见证主机,然后再修复首选站点和辅助站点中的主机。如果首选站点中的所有主机都处于合规状态,则 vSphere Lifecycle Manager 会跳过首选站点,然后开始修复辅助站点中的主机。如果整个集群中的任何主机处于不兼容状态,则修复将停止。有关故障域感知修复以及 vSphere Lifecycle Manager 修复 vSAN 集群中主机的顺序的详细信息,请参见使用 vSphere Lifecycle Manager 映像修复配置了故障域的 vSAN 集群

从 vSphere 8.0 Update 2 开始,可以使用完整 vSphere Lifecycle Manager 映像升级见证主机,其方法与升级独立主机相同。在见证主机上应用的所需映像可以包含基础 ESXi 映像,以及任何用户组件、解决方案组件或 OEM 加载项。

要根据 vSphere Lifecycle Manager 映像修复见证主机,需满足以下要求:
  • vCenter Server 必须为版本 8.0 Update 2 及更高版本。
  • 见证主机必须为 ESXi 版本 7.0 Update 2 及更高版本。
  • 见证主机可以是虚拟服务器和物理服务器。
  • 见证主机可以是专用见证主机和共享见证主机。

使用 vSphere Lifecycle Manager 映像修复配置了故障域的 vSAN 集群

在配置了故障域的 vSAN 集群中,vSphere Lifecycle Manager 会将定义的故障域考虑在内,从而 vSphere Lifecycle Manager 按照依此进行计算的顺序修复主机。

什么是故障域?

故障域包含一个或多个按其在数据中心的物理位置分组的 vSAN 主机。配置后,故障域可让 vSAN 允许整个物理机架故障,以及单个主机、容量设备、网络链接或专用于故障域的网络交换机的故障。可以为非延伸和延伸 vSAN 集群配置故障域。有关配置故障域的详细信息,请参见《管理 VMware vSAN》文档。

升级配置了多个故障域的 vSAN 集群

vSphere Lifecycle Manager 按以下方式修复配置了故障域的 vSAN 集群:一次修复一个故障域中的所有主机。要定义故障域的顺序,vSphere Lifecycle Manager 会进行计算并为 vSAN 集群的每个故障域分配优先级。

修复从具有最高优先级的故障域开始。故障域的优先级通过该故障域中不合规主机的数量确定。故障域中的不合规主机越少,该故障域的优先级越高。但是,如果多个故障域具有相同的优先级,vSphere Lifecycle Manager 会从故障域列表中选择第一个故障域。

vSphere Lifecycle Manager 选择故障域后,vSphere Lifecycle Manager 使用 DRS 建议选择该域中要修复的最佳主机。

对于 vSAN 集群的故障域感知修复,存在以下要求:

  • vCenter Server 必须为版本 7.0 Update 1 及更高版本
  • ESXi 主机必须为版本 7.0 及更高版本

升级启用了 NSXvSphere with TanzuvSAN 集群

您可以根据 vSphere Lifecycle Manager 映像修复 vSAN 集群,该映像包含的 ESXi 版本与当前主机上的 ESXi 版本相同,但包含最新版本的 NSXvSphere with Tanzu 组件。在这种情况下,vSphere Lifecycle Manager 仅升级这些组件,而不升级 ESXi 版本。即使在这些情况下,vSphere Lifecycle Manager 仍可识别 vSAN 集群的已配置故障域,并根据故障域配置执行解决方案升级。

对于启用了 NSXvSphere with TanzuvSAN 集群的故障域感知修复,存在以下要求:
  • vCenter Server 必须为版本 7.0 Update 2
  • ESXi 主机必须为版本 7.0 及更高版本