环境中的控制器在群集级别进行升级。如果可以升级 NSX Controller 群集,则会在网络和安全 (Networking & Security) > 安装和升级 (Installation and Upgrade) > 管理 (Management)面板中的主 NSX Manager 旁边显示一个升级链接。

在维护时段内升级控制器。

执行 NSX Controller 升级时,升级文件会下载到每个控制器节点。控制器会逐个进行升级。升级期间,可升级 (Upgrade Available)链接不可单击,而且系统会阻止升级控制器群集的 API 调用,直至升级已完成。

重要事项: 在 NSX 6.3.3 中,NSX Controller 的底层操作系统发生变化。如果旧控制器和新控制器的操作系统相同,则控制器升级为就地软件升级。如果从 NSX 6.3.2 或更低版本升级到 NSX 6.3.3 或更高版本,则由于操作系统不同,将无法执行就地升级。在这种情况下,会一次删除一个现有控制器,并使用相同的 IP 地址部署基于 Photon OS 的新控制器。

删除控制器时,也会删除任何关联的 DRS 反关联性规则。您必须在 vCenter 中创建新的反关联性规则,以防止新的控制器虚拟机位于同一主机上。

如果在控制器升级开始之前部署新的控制器,这些控制器将部署为旧版本。如果在控制器升级开始后部署新的控制器,这些控制器将部署为新版本。控制器节点必须具有相同版本才能加入群集。

前提条件

  • 确保所有控制器都处于正常状态。当一个或多个控制器处于断开连接状态时,升级无法进行。要重新连接已断开连接的控制器,请尝试重置控制器虚拟设备。在主机和群集 (Hosts and Clusters)视图中,右键单击控制器并选择电源 > 重置 (Power > Reset)。有关 NSX Controller 群集故障排除的详细信息,请参见NSX 故障排除指南中的“NSX Controller 群集故障”。

  • 有效的 NSX Controller 群集包含三个控制器节点。登录到三个控制器节点,然后运行 show control-cluster status 命令。

    controller-node# show control-cluster status 
    			 
    Type                Status                                       Since
    --------------------------------------------------------------------------------
    Join status:        Join complete                                05/04 02:36:03
    Majority status:    Connected to cluster majority                05/19 23:57:23
    Restart status:     This controller can be safely restarted      05/19 23:57:12
    Cluster ID:         ff3ebaeb-de68-4455-a3ca-4824e31863a8
    Node UUID:          ff3ebaeb-de68-4455-a3ca-4824e31863a8
    
    Role                Configured status   Active status
    --------------------------------------------------------------------------------
    api_provider        enabled             activated
    persistence_server  enabled             activated
    switch_manager      enabled             activated
    logical_manager     enabled             activated
    directory_server    enabled             activated
    
    • 对于“加入”状态,请确认控制器节点正在报告“加入完成”。
    • 对于“多数”状态,请确认控制器已连接到群集中的多数节点。
    • 对于群集 ID,群集中的所有控制器节点都具有相同的群集 ID。
    • 对于“已配置”状态和“活动”状态,请确认所有控制器角色的状态均为已启用并激活。
  • 确保您了解执行 NSX Controller 升级时升级对运行产生的影响。请参见NSX 升级对运行产生的影响
  • NSX Controller 群集必须包含三个控制器节点。如果包含的节点少于三个,您必须在开始升级之前添加额外的节点。有关添加控制器节点的步骤,请参见NSX 安装指南中的“部署 NSX Controller 群集”。

过程

  1. 控制器群集状态 (Controller Cluster Status)列中,单击可升级 (Upgrade Available)
    环境中的控制器会逐个进行升级和重新引导。启动升级后,系统首先会下载升级文件,然后升级每个控制器,接着重新引导每个控制器,最后更新每个控制器的升级状态。
  2. 监控升级进度。
    • 您可以在安装和升级 (Installation and Upgrade) > 管理 (Management) > NSX Manager (NSX Managers)控制器群集状态 (Controller Cluster Status)列中查看群集升级进度。
    • 您可以在安装和升级 (Installation and Upgrade) > 管理 (Management) > NSX Controller 节点 (NSX Controller Nodes)升级状态 (Upgrade Status)列中查看每个单独的控制器节点的升级进度。

结果

在升级完成时,“NSX Controller 节点”部分中的软件版本 (Software Version)列将为每个控制器显示 6.4.buildNumber。重新运行 show control-cluster status 命令,以确保控制器能够形成多数。如果未形成 NSX Controller 群集多数,请查看控制器日志和 NSX Manager 日志。

在升级控制器后,可能会为一个或多个控制器节点分配新的控制器 ID。这是预期的行为,这取决于辅助 NSX Manager 何时轮询节点。

每次升级的平均升级时间是 6 到 8 分钟。如果升级未在超时期限(30 分钟)内完成,则升级状态 (Upgrade Status)列会显示失败 (Failed)。再次单击 NSX Manager 区域中的可升级 (Upgrade Available),以从停止的位置恢复升级过程。

如果网络问题导致在 30 分钟超时期限内无法成功升级,请与 VMware 支持部门联系以诊断并解决任何根本问题。

如果控制器升级失败,请检查控制器与 NSX Manager 之间的连接。

升级时会存在以下情况,即第一个控制器升级成功,而第二个控制器升级不成功。假设某个群集包含三个控制器,并且第一个控制器已成功升级到新版本,而第二个控制器正在升级。如果第二个控制器升级失败,则该控制器可能会停留在断开连接状态。同时,第一个和第三个控制器现在具有两种不同版本(一个已升级,另一个未升级),从而无法形成多数。此时,升级无法重新启动。要解决此情况,请创建另一个控制器。新创建的控制器具有较新的 NSX 版本(与第一个控制器匹配),可以与第一个控制器形成多数(仲裁数)。此时,您可以重新启动升级过程。有关创建其他控制器的说明,请参见NSX 故障排除指南中的“重新部署 NSX Controller”。