在修复集群之前对集群运行硬件兼容性检查有助于确保 vSAN 集群具有正常的运行状况,并避免在修复后进入不受支持和不需要的配置。

集群级别硬件兼容性检查仅适用于使用单个映像管理的 vSAN 集群。如果 vSAN 集群使用基准,则无法执行硬件兼容性检查。此外,如果集群使用单个 vSphere Lifecycle Manager 映像,但未启用 vSAN,也无法对该集群执行硬件兼容性检查。根据 vSAN HCL 对 vSAN 集群执行硬件兼容性检查。

要对 vSAN 集群执行硬件兼容性检查,可用于 vSphere Lifecycle ManagervSAN HCL 数据必须为最新。vSAN HCL 数据可自动同步,或者在未连接到 Internet 的环境中,可以手动同步这些数据。有关维护最新 vSAN HCL 数据的详细信息,请参见 vSAN 文档。

对集群启动硬件兼容性检查时, vSphere Lifecycle Manager 会扫描映像并验证映像的所有元素是否与集群内所有主机的硬件兼容。 vSphere Lifecycle Manager 仅验证 vSAN 使用的硬件设备。由于集群级别硬件兼容性检查验证集群硬件与集群映像之间的兼容性,因此,除非已成功修复集群并将映像应用于集群中的所有主机,否则兼容性结果可能不准确。
注: 仅当为 vSphere Lifecycle Manager 配置了硬件支持管理器并将固件加载项添加到 vSphere Lifecycle Manager 映像时, vSphere Lifecycle Manager 才会对 PCI 设备和磁盘驱动器执行完整的驱动程序和固件验证。如果未使用硬件支持管理器, vSphere Lifecycle Manager 仅验证 PCI 设备和网卡设备及其各自的驱动程序版本和磁盘驱动器版本。

硬件兼容性问题会报告为警告,因此不会阻止您根据映像修复集群中的主机,除非通过编辑集群的修复设置更改该行为。有关为集群配置修复设置的信息,请参见为使用单个映像管理的集群或独立主机配置 vSphere Lifecycle Manager 修复设置替代使用单个映像管理的集群的全局 vSphere Lifecycle Manager 修复设置

根据设备的类型,在集群的硬件兼容性检查期间, vSphere Lifecycle Manager 会在硬件兼容性检查期间执行不同的验证。
设备类型 vSphere Lifecycle Manager 验证
存储 I/O 控制器 对于存储 I/O 控制器,vSphere Lifecycle Manager 执行以下验证:
  • 验证所有存储设备控制器是否均已经过认证,可与映像中指定的 ESXi 版本配合使用。
  • 根据 vSAN HCL,验证映像是否包含正确的存储设备驱动程序和固件版本。
  • 根据 vSAN HCL,提供兼容的存储设备驱动程序和固件版本组合建议。
网络控制器 对于网卡设备,vSphere Lifecycle Manager 执行以下验证:
  • 根据 vSAN HCL,验证集群中所有主机上启用了 RDMA 的物理网卡是否均已经过认证,可与映像中指定的 ESXi 版本配合使用。
  • 根据 vSAN HCL,验证集群使用的映像是否包含正确的网卡驱动程序和固件版本。
  • 根据 vSAN HCL,提供适用于集群的兼容网卡驱动程序和固件版本组合建议。
  • 验证设备是否针对该设备上启用的所有活动功能进行了认证。

    例如,如果 vSAN 使用支持 RDMA 的网卡,vSphere Lifecycle Manager 将验证该网卡是否已针对 RDMA 进行认证。

磁盘驱动器 对于磁盘驱动器,vSphere Lifecycle Manager 执行以下验证:
  • 根据 vSAN HCL,验证集群中的所有磁盘驱动器是否经认证可与映像中指定的 ESXi 版本配合使用。
  • 根据 vSAN HCL,验证在集群映像中指定的磁盘驱动器固件版本是否等于或高于设备支持的最低固件版本。
    注: vSphere Lifecycle Manager 不仅对直接连接的磁盘驱动器执行这些验证,而且对 RAID-0 逻辑卷后面和 VMD 控制器后面的物理磁盘驱动器执行这些验证。

什么是当前处于活动状态的功能

设备的活动功能列表是在该设备上启用且该设备可以支持的软件功能列表。设备启用的活动功能是启用或使用解决方案或服务的结果。在 vSphere Client 中,有关设备上当前处于活动状态的功能的信息仅针对 PCI 设备(存储控制器和网络控制器)显示。磁盘驱动器不会显示当前处于活动状态的功能列表。

当解决方案或服务(例如 vSAN 或 NSX)在设备上启用一组功能时,这些功能会对该设备施加特定的硬件兼容性限制。该设备必须针对 vSAN 使用的这些活动功能进行认证。在硬件兼容性检查期间,除了验证 PCI 设备的驱动程序和固件组合外,vSphere Lifecycle Manager 还会验证活动功能对该设备施加的限制。因此,通过运行硬件兼容性检查,可以确保在 vSAN 集群中的设备上仅启用经过认证的功能。对于设备上未启用的功能,不会出现兼容性问题。

设备的一组活动功能发生更改时,必须重新运行硬件兼容性检查才能获得正确的合规性结果。

硬件兼容性检查结果

执行硬件兼容性检查后,vSphere Lifecycle Manager 会将设备列为合规或不合规。在某些情况下,兼容性状态为不可用。

合规
当设备与集群中为映像定义的 ESXi 版本以及驱动程序和固件版本兼容时,该设备合规。对于 PCI 设备,驱动程序-固件版本组合也必须针对相应设备上启用的所有活动功能进行认证。
不合规
当设备与集群中为映像定义的 ESXi、驱动程序或固件版本不兼容时,该设备不合规。此外,如果驱动程序-固件版本组合未针对相应设备上启用的所有活动功能进行认证,则 PCI 设备不合规。

如果设备根本未包含在 vSAN HCL 中,则 vSphere Lifecycle Manager 将该设备标记为不合规。

不可用
在以下情况下,网卡设备的硬件兼容性状态为不可用:
  • 如果 vSAN HCL 数据未更新,且不包含有关在设备上启用的活动功能对该设备所施加限制的信息,则 PCI 设备的兼容性信息不可用。
  • 集群未包含任何主机,或者集群中的某些主机无法访问。
  • 未在 vCenter Server 中注册硬件支持管理器,或者集群映像不包含固件和驱动程序加载项。

硬件兼容性检查任务何时运行

vSphere Lifecycle Manager 可对使用单个映像管理的 vSAN 集群定期执行硬件兼容性检查。此外,某些 vSphere Lifecycle Manager 操作也会触发自动硬件兼容性检查。自动硬件兼容性检查适用于使用单个映像的 vSAN 集群。

有关硬件兼容性检查的信息以及如何对集群或单个主机手动执行硬件兼容性检查的说明,请参见集群和主机的 vSphere Lifecycle Manager 硬件兼容性检查

硬件兼容性检查任务

vSAN 硬件兼容性列表 (vSAN HCL) 数据库会定期更新。例如,当 VMware 认证新的 OEM 设备、驱动程序或固件时,这些将列在 vSAN HCL 数据库中。同样,不再支持的设备、驱动程序或固件将从 vSAN HCL 数据库中移除。

vSAN HCL 数据库更新可能会使硬件兼容性结果无效并过时。为了向您提供有效的硬件兼容性信息,vSphere Lifecycle Manager 会根据最新的 vSAN HCL 数据定期运行硬件兼容性检查。

定期硬件兼容性检查是一项预先配置的已调度任务,可以随时对其进行编辑并强制运行。默认情况下,该任务每 24 小时运行一次。此已调度任务在 vCenter Server 级别进行配置。如果 vCenter Server 系统不包含使用单个映像管理的 vSAN 集群,vSphere Lifecycle Manager 将跳过已调度的硬件兼容性检查。此定期任务仅针对使用单个映像管理的 vSAN 集群运行。

触发硬件兼容性检查的 vSphere Lifecycle Manager 操作

在以下情况下, vSphere Lifecycle Manager 会对使用单个映像管理的任何 vSAN 集群执行自动硬件兼容性检查。
  • 编辑集群的映像并保存映像。

    编辑并保存映像时,vSphere Lifecycle Manager 便会启动检查集群主机硬件与映像兼容性的任务,即使集群不包含 vSAN,也会启动此任务。在这种情况下,vSphere Lifecycle Manager 仅返回一条警告,指出在非 vSAN 集群中未验证映像硬件兼容性。

    如果自动触发的硬件兼容性任务失败,仍可以保存集群的新映像。

  • 启动修复预检查或修复。

    硬件兼容性检查是对 vSAN 集群执行修复预检查和修复任务的一部分。如果集群未启用 vSAN,则在启动修复预检查或修复时,vSphere Lifecycle Manager 不执行硬件兼容性检查。

    可以通过编辑集群的修复设置来配置 vSphere Lifecycle Manager 在出现硬件兼容性问题时的行为。有关为集群配置修复设置的信息,请参见为使用单个映像管理的集群或独立主机配置 vSphere Lifecycle Manager 修复设置替代使用单个映像管理的集群的全局 vSphere Lifecycle Manager 修复设置

  • 在集群中添加或移除主机。

    在集群中添加或移除主机时,vSphere Lifecycle Manager 会使集群的硬件兼容性检查结果失效并发出警告。必须重新运行硬件兼容性检查才能获取有关潜在硬件兼容性问题的有效信息。或者,也可以修复集群或运行修复预检查,这两种操作都会自动触发硬件兼容性检查。

网卡验证

从 vSphere 8.0 开始,针对 vSAN 集群的硬件兼容性检查已增强,纳入了针对 vSAN HCL 的网卡验证。确定 vSAN 集群中的网卡与集群使用的映像中定义的软件之间的兼容性对于成功升级集群至关重要。

在硬件兼容性检查期间,对于每个网卡设备,vSphere Lifecycle Manager 会验证集群的映像中定义的驱动程序和固件版本组合是否经认证可与设备上启用的所有活动功能配合使用。

对于网卡设备,vSphere Lifecycle Manager 会在硬件兼容性检查期间检查确切的固件版本。

vSAN 集群中,在硬件兼容性检查期间,vSphere Lifecycle Manager 只会验证 vSAN 使用的支持 RDMA 的网卡。也就是说,如果主机具有支持 RDMA 的网卡,但该网卡未在使用,则 vSphere Lifecycle Manager 不会验证该设备的硬件兼容性。vSphere Lifecycle Manager 不会验证非 RDMA 网卡。vSAN 使用的非 RDMA 网卡不需要认证,因此 vSphere Lifecycle Manager 在硬件兼容性检查期间不会对其进行验证。

网卡验证的系统要求

  • vCenter Server 8.0 及更高版本
  • ESXi 8.0 及更高版本

磁盘驱动器验证

在集群级别硬件兼容性检查期间,vSphere Lifecycle Manager 会根据 vSAN 硬件兼容性列表 (vSAN HCL) 验证 vSAN 使用的磁盘驱动器是否受支持且经过认证。vSphere Lifecycle Manager 还可确保集群映像中指定的磁盘驱动器固件版本与集群硬件兼容。

vSAN 集群中的磁盘驱动器和驱动器上安装的固件对于 vSAN 集群的整体运行状况至关重要。例如,磁盘驱动器固件出现故障可能会导致出现性能问题和意外的 vSAN 输入-输出行为。可以使用 vSphere Lifecycle Manager 硬件支持管理器执行磁盘驱动器固件升级。但是,在升级磁盘驱动器固件之前,必须根据 vSAN HCL 确保目标固件版本受支持。
注: 对于 SAS 和 SATA 磁盘驱动器, vSAN HCL 列出了支持的最低固件版本。支持高于 vSAN HCL 中所指定版本的所有固件版本。对于 VMD 控制器后面的 NVMe 设备, vSAN HCL 列出了经认证可与给定 ESXi 基础映像版本配合使用的确切驱动程序-固件组合。仅支持在 vSAN HCL 中列出的特定驱动程序-固件版本组合。

支持的磁盘驱动器类型

vSphere Lifecycle Manager 验证以下类型的磁盘驱动器和存储设备配置:
  • HDD (SAS/SATA)
  • SSD (SAS/SATA)
  • 单磁盘 RAID-0 逻辑卷后面的 SAS/SATA 磁盘驱动器
  • VMD 控制器后面的 NVMe 设备
    注: vSphere Lifecycle Manager 将未启用 VMD 的 NVMe 设备视为 PCI 存储控制器。在 vSphere Client 中,有关未启用 VMD 的 NVMe 设备的硬件兼容性信息显示在 PCI 设备选项卡上,而不是显示在 磁盘选项卡上。

磁盘驱动器验证的系统要求

  • vCenter Server 7.0 Update 3 及更高版本
  • ESXi 7.0 及更高版本
  • 验证 VMD 控制器后面的 NVMe 设备:vCenter Server 8.0 及更高版本以及 ESXi 8.0 及更高版本
    重要说明: 如果主机的 ESXi 版本低于 8.0,则硬件兼容性检查不会验证 VMD 控制器后面的 NVMe 设备。对于运行早期版本的 ESXi(例如 7.0 Update 3)的主机,如果要检查 VMD 控制器后面的 NVMe 设备的硬件兼容性,可以使用以下解决办法:
    • 手动覆盖 VMD 控制器后面的 NVMe 设备的合规性状态。
    • 将主机升级到 ESXi 8.0 或更高版本。

RAID-0 逻辑卷

vSphere Lifecycle Manager 可以验证位于单磁盘 RAID-0 逻辑卷后面的物理 SAS/SATA 磁盘驱动器。存在以下要求:
  • RAID 控制器处于 RAID 或混合模式。

    有关 RAID 和混合模式的详细信息,请参见 VMware 知识库文章,网址为 https://kb.vmware.com/s/article/53573

  • vCenter Server 7.0 Update 3 及更高版本
  • ESXi 7.0 及更高版本
  • 硬件支持管理器必须进行升级和认证才能与 vSphere 7.0 Update 3 配合使用。

    如果不使用升级版本的硬件支持管理器,则 RAID-0 逻辑卷后面物理驱动器的合规性状态将未知。在这种情况下,您必须手动验证磁盘驱动器和目标固件版本,并替代这些磁盘的合规性状态。

磁盘驱动器验证结果

vSphere Lifecycle Manager 不显示 vSAN 磁盘组中每个磁盘的磁盘驱动器兼容性状态和兼容性信息。vSphere Lifecycle Manager 按供应商、型号、目标固件版本、容量和部件号对 vSAN 使用的磁盘驱动器进行分组。也就是说,同一供应商、同一型号且具有相同目标固件版本的所有磁盘驱动器构成磁盘设备列表中的一个条目。

磁盘驱动器可以合规,也可以不合规。如果 vSphere Lifecycle ManagervSAN HCL 中找不到磁盘设备的唯一匹配项,vSphere Lifecycle Manager 会提示您手动指定要验证的确切设备。之后,vSphere Lifecycle Manager 根据您的选择计算合规性状态。

vSphere Lifecycle Manager 无法确定磁盘驱动器合规性时,相应的设备将列为不合规。可以手动验证这些设备,并将合规性状态设置为合规或不合规。有关详细信息,请参见手动更改磁盘设备的合规性状态

对于磁盘设备列表中的每个条目,可以查看磁盘的汇总信息、合规性状态、受影响的主机数量,以及显示合规性状态是否手动设置或设备是否已经过认证的标签。由 vSAN 使用标签附加到 vSAN 使用的所有磁盘设备。合规或不合规磁盘列表中的每个条目都包含带有标签的标题和详细描述。

如果展开该条目,您可以查看有关相应磁盘设备和受影响主机的详细合规性信息。

将新磁盘添加到 vSAN 集群时,必须手动重新运行检查才能获取有关集群的新合规性信息。同样,如果从 vSAN 磁盘组中移除磁盘,也必须重新运行硬件兼容性检查才能获取有关集群的更新合规性信息。