请参阅此处提供的示例 YAML,置备对集群节点使用 Ubuntu 操作系统的 TanzuKubernetesCluster 集群。此类集群可用于 vGPU 工作负载。
v1alpha3 示例:使用 Ubuntu TKR 的 TKC
默认情况下,对 TKG 集群节点使用指定 TKR 的 PhotonOS 版本。如果引用的 TKR 支持 OSImage 格式并具有可用的 Ubuntu 操作系统版本,请使用 run.tanzu.vmware.com/resolve-os-image: os-name=ubuntu
注释指定 TKR 的 Ubuntu 操作系统版本。有关 OSImage 格式的详细信息,请参见 Tkr 操作系统映像格式。
AI/ML 工作负载需要使用 Ubuntu TKR。每个工作节点池都有一个单独的卷用于容器运行时和 kubelet,每个卷的容量为 70 GiB。建议为基于容器的 AI/ML 工作负载提供此大小的单独卷。
apiVersion: run.tanzu.vmware.com/v1alpha3 kind: TanzuKubernetesCluster metadata: name: tkc-ubuntu-gpu namespace: tkg-cluster-ns annotations: run.tanzu.vmware.com/resolve-os-image: os-name=ubuntu spec: topology: controlPlane: replicas: 3 storageClass: tkg-storage-policy vmClass: guaranteed-large tkr: reference: name: v1.25.7---vmware.3-fips.1-tkg.1 nodePools: - name: nodepool-a100-primary replicas: 3 storageClass: tkg-storage-policy vmClass: vgpu-a100 tkr: reference: name: v1.25.7---vmware.3-fips.1-tkg.1 volumes: - name: containerd mountPath: /var/lib/containerd capacity: storage: 70Gi - name: kubelet mountPath: /var/lib/kubelet capacity: storage: 70Gi - name: nodepool-a100-secondary replicas: 3 storageClass: tkg-storage-policy vmClass: vgpu-a100 tkr: reference: name: v1.25.7---vmware.3-fips.1-tkg.1 volumes: - name: containerd mountPath: /var/lib/containerd capacity: storage: 70Gi - name: kubelet mountPath: /var/lib/kubelet capacity: storage: 70Gi settings: storage: defaultClass: tkg-storage-policy network: cni: name: antrea services: cidrBlocks: ["198.51.100.0/12"] pods: cidrBlocks: ["192.0.2.0/16"] serviceDomain: cluster.local