VMware Cloud Director 10.3.1 开始,可以使用 Kubernetes Container Clusters UI 插件创建 Tanzu Kubernetes Grid 集群。

前提条件

过程

  1. 登录到 VMware Cloud Director,然后从顶部导航栏中,选择更多 > Kubernetes 容器集群 > 新建
  2. 选择 VMware Tanzu Kubernetes Grid 运行时选项,然后单击下一步
  3. 输入名称,从列表中选择 Kubernetes 模板,然后单击下一步
  4. VDC 和网络窗口中,选择要部署 Tanzu Kubernetes Grid 集群的组织 VDC,为集群选择 VDC 网络,然后单击下一步
  5. 控制平面窗口中,选择节点数、磁盘大小,并(可选)选择大小调整策略、放置策略、存储配置文件,然后单击下一步
    注: 输入的节点数可允许集群具有多个控制平面节点。
  6. 工作节点池窗口中,输入名称、节点数、磁盘大小,并(可选)选择大小调整策略、放置策略、存储配置文件,然后单击下一步。有关工作节点池的详细信息,请参见使用工作节点池
    注:
    • 要配置 vGPU 设置,请选择激活 GPU 开关,然后选择 vGPU 策略。有关 vGPU 配置的详细信息,请参见在 Tanzu Kubernetes Grid 集群上配置 vGPU 以允许人工智能和机器学习工作负载
    • 创建具有 vGPU 功能的集群时,建议将磁盘大小增加到 40-50 GB 之间,因为 vGPU 库会占用大量存储空间。
    • 可以在此工作流中选择大小调整策略,也可以在 VMware Cloud Director Container Service Extension 服务器配置中单独选择。如果选择大小调整策略以与 vGPU 策略结合使用,而该 vGPU 策略包含 VM 大小调整,则 vGPU 策略中的大小调整信息优先于选定的大小调整策略。建议在 vGPU 策略中包括大小调整,并且仅在将大小调整策略字段留空时指定 vGPU 策略。
  7. (可选) 要创建其他工作节点池,请单击添加新的工作节点池,然后配置工作节点池设置。
  8. 单击下一步
  9. Kubernetes 存储窗口中,激活创建默认存储类开关,选择存储配置文件,然后输入存储类名称。
  10. (可选) 配置回收策略文件系统设置。
  11. Kubernetes 网络窗口中,指定用于 Kubernetes 服务的 IP 地址范围和用于 Kubernetes Pod 的范围,然后单击下一步

    无类别域间路由 (CIDR) 是一种 IP 路由和 IP 地址分配方法。

    选项 描述
    Pod CIDR 指定要用于 Kubernetes Pod 的 IP 地址范围。默认值为 100.96.0.0/11。Pod 子网大小必须等于或大于 /24。可以输入一个 IP 范围。
    服务 CIDR 指定要用于 Kubernetes 服务的 IP 地址范围。默认值为 100.64.0.0/13。可以输入一个 IP 范围。
    控制平面 IP 租户用户可以将其自己的 IP 地址指定为控制平面端点。他们可以使用网关中的外部 IP 地址,也可以使用不同于路由 IP 范围的子网中的内部 IP 地址。如果他们未将 IP 地址指定为控制平面端点,VMware Cloud Director Container Service Extension 服务器将从关联的租户网关中选择一个未使用的 IP 地址。
    虚拟 IP 子网 租户用户可以指定一个子网 CIDR,从中分配一个未使用的 IP 地址作为控制平面端点。子网必须表示网关中存在的一组地址。同一 CIDR 还会作为集群上输入服务的子网 CIDR 进行传播。
    可以使用以下 IP 地址作为控制平面 IP:
    IP 类型 描述
    外部 IP 地址 连接到 OVDC 网络的外部网关中的任何 IP 地址。
    内部 IP 地址 租户内部的任何专用 IP 地址,但以下 IP 地址除外:
    • LB 网络服务定义中的 IP 地址,通常为 192.168.255.1/24。
    • 组织 VDC IP 子网中的 IP 地址。
    • 正在使用的 IP 地址。
    注: 如果 IP 地址不具有上述特性,则会出现以下行为:
    • 如果 IP 地址已在使用中,并且 VMware Cloud Director 检测到该使用情况,则在创建 LB 期间,日志中会显示错误。
    • 如果 IP 地址已在使用中,但 VMware Cloud Director 未检测到该使用情况,则行为未定义。
  12. 调试设置窗口中,激活或停用出错时自动修复开关和节点运行状况检查开关。
    切换 描述
    出错时自动修复 此功能适用于在集群创建过程中发生的故障。如果激活此开关,VMware Cloud Director Container Service Extension 服务器将尝试重新创建在此过程中处于错误状态的集群。如果停用此开关,VMware Cloud Director Container Service Extension 服务器会使集群处于错误状态以进行手动故障排除。
    注:VMware Cloud Director Container Service Extension 4.1 中,此开关默认处于停用状态。服务提供商必须告知租户用户这一点,因为这是不同于 VMware Cloud Director Container Service Extension 4.0 的一种行为更改。
    节点运行状况检查 与修复过程仅在集群创建期间适用的“出错时自动修复”相反,“节点运行状况检查”中的修复过程在集群达到可用状态后开始。如果任何节点在集群生命周期内变得不正常,“节点运行状况检查”将检测并修复这些节点。有关详细信息,请参见节点运行状况检查配置
    注:VMware Cloud Director Container Service Extension 4.1 中,此开关默认处于停用状态。
  13. 输入 SSH 公钥。
  14. 单击下一步
  15. 检查集群设置,然后单击完成
    注:检查窗口中,将显示一条警告,提示集群包含所有者的 API 令牌,不要与其他人直接共享 kubeconfig 或集群,而是以组织的租户用户身份创建集群。

查看集群状态

VMware Cloud Director Container Service Extension 中创建 Tanzu Kubernetes Grid 集群时,将显示以下状态:

表 1. 集群状态
集群状态 描述
挂起 集群请求尚未由 VMware Cloud Director Container Service Extension 服务器处理。
正在创建 集群当前正在由 VMware Cloud Director Container Service Extension 服务器处理。
可用 集群已准备就绪,用户可进行操作并将其用于托管工作负载。
正在删除 正在删除集群
错误 集群处于错误状态。
注: 如果要手动调试集群,请停用 出错时自动修复模式。