VMware Cloud Director 10.3.1 開始,可以使用 Kubernetes Container Clusters UI 外掛程式建立 Tanzu Kubernetes Grid 叢集。

必要條件

程序

  1. 登入 VMware Cloud Director,然後從頂部導覽列中選取更多 > Kubernetes Container Clusters > 新增
  2. 選取 VMware Tanzu Kubernetes Grid 執行階段選項,然後按下一步
  3. 輸入名稱,從清單中選取 Kubernetes 範本,然後按下一步
  4. VDC 和網路視窗中,選取要將 Tanzu Kubernetes Grid 叢集部署到的組織 VDC,為叢集選取 VDC 網路,然後按下一步
  5. 控制平面視窗中,選取節點數目、磁碟大小,並 (可選) 選取大小調整原則、放置原則、儲存區設定檔,然後按下一步
    備註: 輸入的節點數目可允許叢集具有多個控制平面節點。
  6. 工作集區視窗中,輸入名稱、節點數目、磁碟大小,並 (可選) 選取大小調整原則、放置原則、儲存區設定檔,然後按下一步。如需有關 worker 節點集區的詳細資訊,請參閱使用 worker 節點集區
    備註:
    • 若要設定 vGPU 設定,請選取啟用 GPU 切換按鈕,然後選取 vGPU 原則。如需有關 vGPU 組態的詳細資訊,請參閱在 Tanzu Kubernetes Grid 叢集上設定 vGPU 以允許人工智慧和機器學習工作負載
    • 建立具有 vGPU 功能的叢集時,建議將磁碟大小增加到 40-50 GB 之間,因為 vGPU 庫會佔用大量儲存空間。
    • 可以在此工作流程中選取大小調整原則,也可以在 VMware Cloud Director Container Service Extension 伺服器設定中單獨選取。如果選取大小調整原則以與 vGPU 原則結合使用,而該 vGPU 原則包含虛擬機器大小調整,則 vGPU 原則中的大小調整資訊優先於所選的大小調整原則。建議在 vGPU 原則中包括大小調整,並且僅在將大小調整原則欄位留空時指定 vGPU 原則。
  7. (選擇性) 若要建立其他 worker 節點集區,請按一下新增工作集區,然後設定 worker 節點集區設定。
  8. 下一步
  9. Kubernetes 儲存區視窗中,啟用建立預設儲存區類別切換按鈕,選取儲存區設定檔,然後輸入儲存區類別名稱。
  10. (選擇性) 設定回收原則檔案系統設定。
  11. Kubernetes 網路視窗中,指定 Kubernetes 服務的 IP 位址範圍和 Kubernetes 網繭的範圍,然後按下一步

    無類別網域間路由 (CIDR) 是一種 IP 路由和 IP 位址配置方法。

    選項 描述
    網繭 CIDR 指定要用於 Kubernetes 網繭的 IP 位址範圍。預設值為 100.96.0.0/11。網繭子網路大小必須等於或大於 /24。您可以輸入一個 IP 範圍。
    服務 CIDR 指定要用於 Kubernetes 服務的 IP 位址範圍。預設值為 100.64.0.0/13。您可以輸入一個 IP 範圍。
    控制平面 IP 承租人使用者可以將其自己的 IP 位址指定為控制平面端點。他們可以使用閘道中的外部 IP 位址,也可以使用不同於路由 IP 範圍的子網路中的內部 IP 位址。如果未將 IP 位址指定為控制平面端點,VMware Cloud Director Container Service Extension 伺服器將從關聯的承租人閘道中選取一個未使用的 IP 位址。
    虛擬 IP 子網路 承租人使用者可以指定一個子網路 CIDR,會將其中一個未使用的 IP 位址指派為控制平面端點。子網路必須表示閘道中存在的一組位址。同一 CIDR 還會作為叢集上入口服務的子網路 CIDR 進行傳播。
    可以使用以下 IP 位址作為控制平面 IP:
    IP 類型 描述
    外部 IP 位址 連線到 OVDC 網路的外部閘道中的任何 IP 位址。
    內部 IP 位址 承租人內部的任何私人 IP 位址,但以下 IP 位址除外:
    • LB 網路服務定義中的 IP 位址,通常為 192.168.255.1/24。
    • 組織 VDC IP 子網路中的 IP 位址。
    • 正在使用的 IP 位址。
    備註: 如果 IP 位址不具有上述特性,則會出現以下行為:
    • 如果 IP 位址已在使用中,並且 VMware Cloud Director 偵測到該使用情況,則在建立 LB 期間,記錄中會顯示錯誤。
    • 如果 IP 位址已在使用中,但 VMware Cloud Director 未偵測到該使用情況,則行為未定義。
  12. 偵錯設定視窗中,啟用或停用出現錯誤時自動修復切換按鈕和節點健全狀況檢查切換按鈕。
    切換 描述
    出現錯誤時自動修復 此功能適用於在叢集建立過程中發生的故障。如果啟用此切換按鈕,VMware Cloud Director Container Service Extension 伺服器將嘗試重新建立在此過程中處於錯誤狀態的叢集。如果停用此切換按鈕,VMware Cloud Director Container Service Extension 伺服器會使叢集處於錯誤狀態以進行手動疑難排解。
    備註:VMware Cloud Director Container Service Extension 4.1 中,此切換按鈕預設處於停用狀態。服務提供者必須告知承租人使用者這一點,因為這是不同於 VMware Cloud Director Container Service Extension 4.0 的一種行為變更。
    節點健全狀況檢查 與修復程序僅在叢集建立期間適用的「出現錯誤時自動修復」相反,「節點健全狀況檢查」中的修復程序在叢集達到可用狀態後開始。如果任何節點在叢集生命週期內變得狀況不良,「節點健全狀況檢查」將偵測並修復這些節點。如需詳細資訊,請參閱節點健全狀況檢查組態
    備註:VMware Cloud Director Container Service Extension 4.1 中,此切換按鈕預設處於停用狀態。
  13. 輸入 SSH 公開金鑰。
  14. 下一步
  15. 檢閱叢集設定,然後按一下完成
    備註:檢閱視窗中,將顯示一則警告,提示叢集包含擁有者的 API Token,不要與其他人直接共用 kubeconfig 或叢集,而是以組織的承租人使用者身分建立叢集。

檢閱叢集狀態

VMware Cloud Director Container Service Extension 中建立 Tanzu Kubernetes Grid 叢集時,將顯示以下狀態:

表 1. 叢集狀態
叢集狀態 描述
擱置中 叢集要求尚未由 VMware Cloud Director Container Service Extension 伺服器處理。
正在建立 叢集目前正在由 VMware Cloud Director Container Service Extension 伺服器處理。
可用 叢集已準備就緒,使用者可進行操作並將其用於託管工作負載。
正在刪除 正在刪除叢集
錯誤 叢集處於錯誤狀態。
備註: 如果要手動偵錯叢集,請停用 出現錯誤時自動修復模式。