对使用主机配置文件和 TNP 自动部署无状态集群时它们存在的问题进行故障排除。

场景 描述

在启用多个 VMkernel 适配器以支持管理后,vMotion 流量和其他流量会迁移到同一逻辑交换机时,VMkernel 适配器将在重新引导后迁移到逻辑交换机。但某个 VMkernel 适配器上的服务会在另一个适配器上启用。

例如,在迁移之前,启用 vmk0 以支持管理流量,并启用 vmk1 以支持 vMotion 流量。主机重新引导后,vmk0 支持 vMotion 流量,vmk1 支持管理流量。重新引导后这会导致不合规错误。

解决办法:无。因为两个 VMkernel 适配器均位于同一逻辑交换机上,因此不会产生任何影响。
当节点状态显示为已启动时,主机准备进度停滞在 60%。 问题:对集群应用 TNP 后,NSX 成功安装在主机上,并且节点状态显示为已启动,但 GUI 显示的进度仍为 60%。

解决办法:重新应用 TNP 或 TN 配置,而无需对配置进行任何更改。这样可将 GUI 上的状态修复为 100%。

在移除主机交换机之前,即使 VMkernel 迁移成功,TN 上仍存在验证错误。

问题:将管理接口 vmk0 从 vSwitch 迁移到逻辑交换机时,NSX 已成功安装在主机上。VMkernel 迁移成功,但 TN 状态显示“部分成功”并出现错误。

Validation before host switches removal failed: [error: No management vmk will have PNIC after ['vmk1'] in ['9a bb eb c1 04 81 40 e2-bc 3f 3e aa bd 14 62 1e'] lose all PNICs.]; LogicalSwitch full-sync: LogicalSwitch full-sync realization query skipped.

解决办法:无。忽略该错误消息,因为 VMkernel 迁移已成功。

重新应用 TNP 时,如果“用于安装的网络映射”列出了 vmk0,则会导致主机断开连接。 问题:当 TNP 配置包含“用于安装的网络映射”中的 vmk0 时,主机将断开连接。

解决办法:使用 TNP 中的必要配置重新引导主机,而不是重新应用 TNP。

无法应用主机配置文件,因为 MUX 用户密码策略和密码未重置。

问题:仅在运行 vSphere 6.7 U3 之前版本的主机上出现此问题。主机上的主机修复和主机配置文件应用程序可能会失败,除非重置 mux_user 密码。

解决办法:在“策略和配置文件”下,编辑主机配置文件以修改 mux_user 密码策略并重置 mux_user 密码。

主机配置文件不可移植。

问题:任何 vCenter Server 都不能使用包含 NSX 配置的主机配置文件。

解决办法:无。

自动部署规则引擎

问题:无法在自动部署规则中使用主机配置文件来部署新集群。如果部署了新集群,则主机将使用基本网络连接进行部署,并将保持维护模式。

解决办法:从 NSX GUI 中准备每个集群。请参见对无状态集群应用 TNP

检查合规性错误。

问题:主机配置文件修复无法修复与 NSX 配置相关的合规性错误。

  • 主机配置文件和 TNP 上配置的物理网卡不同。
  • vNIC 到 LS 映射之间的映射。主机配置文件发现逻辑交换机中到 vNIC 的映射与 TNP 配置文件不匹配。
  • 主机配置文件和 TNP 上连接到 N-VDS 的 VMkernel 不匹配。
  • 主机配置文件和 TNP 上的 Opaque 交换机不匹配。

解决办法:确保主机配置文件和 TNP 上的 NSX 配置匹配。重新引导主机以实现配置更改。主机将启动。

修复

问题:如果存在任何 NSX 特定的合规性错误,则会阻止该集群上的主机配置文件修复。

配置不正确:

  • vNIC 到 LS 映射之间的映射
  • 物理网卡的映射

解决办法:确保主机配置文件和 TNP 上的 NSX 配置匹配。重新引导主机以实现配置更改。主机将启动。

连接

问题:在配置了 NSX 的集群中,无法在主机级别连接主机配置文件。

解决办法:无。

断开连接

问题:在配置了 NSX 的集群中断开连接和连接新的主机配置文件时,不会移除 NSX 配置。即使集群与新连接的主机配置文件兼容,它仍会包含先前配置文件中的 NSX 配置。

解决办法:无。

更新

问题:如果用户更改了集群中的 NSX 配置,则会提取新的主机配置文件。对于丢失的所有设置,需要手动更新主机配置文件。

解决办法:无。

主机级别的传输节点配置

问题:自动部署 anportsport 节点后,它将充当单个实体。对该传输节点的任何更新都可能与 TNP 不匹配。

解决办法:更新集群。独立传输节点中的任何更新都无法保留其迁移规范。迁移可能无法发布重新引导。

选定用于迁移到 NVDS 交换机的 VMkernel 适配器不支持 PeerDNS 配置。

问题:如果选定用于迁移到 NVDS 的 VMkernel 适配器启用对等 DNS,则主机配置文件应用程序会失败。

解决办法:通过在必须迁移到 NVDS 交换机的 VMkernel 适配器上禁用对等 DNS 设置,编辑提取的主机配置文件。或者,确保不要将启用了对等 DNS 的 VMkernel 适配器迁移到 NVDS 交换机。

不会保留 VMkernel 网卡地址的 DHCP 地址

问题:如果引用主机是有状态主机,则对于使用从有状态引用主机提取的配置文件的任何无状态主机,都无法保留其源自 PXE 启动的 MAC 的 VMkernel 管理 MAC 地址。这会导致 DHCP 寻址问题。

解决办法:编辑从有状态主机提取的主机配置文件,并将“确定应如何决定 vmknic 的 MAC 地址”修改为“使用 PXE 用于启动系统的 MAC 地址”。

vCenter 中的主机配置文件应用程序故障可能会导致主机上出现 NSX 配置错误。

问题:如果 vCenter 中的主机配置文件应用程序出现故障,则 NSX 配置可能也会失败。

解决办法:在 vCenter 中,确认已成功应用主机配置文件。修复错误,然后重试

无状态 ESXi 主机不支持 LAG。

问题:由 vCenter Server 管理或者在 NSX 中管理的无状态 ESXi 主机不支持配置为 NSX 中 LAG 的上行链路配置文件。

解决办法:无。

当无状态主机应用了从有状态主机提取的主机配置文件时,无法使用 PXE 网卡的 MAC 地址引导无状态主机。 问题:如果无状态主机附加了从有状态主机提取的主机配置文件,则将无法使用主机 PXE 网卡的 MAC 地址引导无状态主机的 VMkernel 适配器 (vmknic),因为有状态主机无法作为已启用 PXE 的系统来引导。

解决办法:在设置无状态主机的自动部署时,请确保从可作为已启用 PXE 的系统来引导的主机提取主机配置文件。