請參閱此主題,為 NVIDIA Grid vGPU 裝置建立自訂虛擬機器類別。

使用 vGPU 設定檔建立自訂虛擬機器類別 (v8 U2 P03 及更新版本)

NVIDIA vGPU (虛擬圖形處理單元) 支援多個虛擬機器 (VM) 共用單一實體 CPU。若要將 vGPUs 與 TKGS 叢集搭配使用,請定義自訂虛擬機器類別。從此版本開始,提供了一個用於定義自訂虛擬機器類別的新精靈。與用於定義自訂虛擬機器類別的先前方法不同,此方法將從裝置中讀取 vGPU 設定檔,而不是在虛擬機器類別中進行設定。

虛擬機器運算子會輪詢 vCenter 詳細目錄,以取得 ESXi 主機 (包含部署了 主管 的 vSphere 叢集) 上安裝的所有 vGPU 裝置。vGPU 裝置定義其設定檔。vGPU 裝置名稱指示設定檔是多執行個體 GPU (MIG) 還是時間共用 GPU。MIG 將劃分計算,支援多個工作負載在單一 GPU 上並行執行。時間共用提供 GPU 的共用存取權。MIG 模式基於較新的 GPU 架構,僅在 NVIDIA A100 和 A30 裝置上受支援。如需詳細資訊,請參閱 NVIDIA 說明文件

例如,GPU 裝置「grid-a100-40c」提供了時間共用 vGPU 設定檔,該設定檔會將具有 40 GB 記憶體的 NVIDIA A100 GPU 裝置配置給虛擬機器。以 MIG 為基礎的等效 vGPU 設定檔將是「grid-a100-7-40c」裝置。您可以確定它是一個 MIG 設定檔,因為裝置和 RAM 之間有額外的數字。「7」表示 GPU 裝置上有 7 個計算配量。以 MIG 為基礎的 vGPU 設定檔可具有 1、2、3 或 7 個計算配量。

  1. vSphere Client 主功能表中,選取工作負載管理 > 服務
  2. 選取 虛擬機器類別索引標籤。
  3. 按一下建立虛擬機器類別

    此動作將啟動「建立虛擬機器類別」精靈,指導您建立虛擬機器類別。

  4. 對於名稱,輸入虛擬機器類別的名稱,然後按下一步
    虛擬機器類別名稱用於識別虛擬機器類別。輸入遵循以下要求的符合 DNS 標準的唯一名稱:
    • 使用不與環境中預設或自訂虛擬機器類別名稱重複的唯一名稱。
    • 使用最大長度為 63 個字元的英數字元字串。
    • 請勿使用大寫字母或空格。
    • 在任意位置使用破折號,但第一個或最後一個字元除外。例如,vm-class1
    • 建立虛擬機器類別後,無法變更其名稱。
  5. 對於相容性,選取 ESXi 8.0 U2 及更新版本,然後按下一步
    如需詳細資訊,請參閱 虛擬機器相容性
    備註: 建立虛擬機器類別後,無法變更其硬體相容性。
  6. 對於組態 > 虛擬硬體,將 NVIDIA GPU 裝置新增到虛擬機器類別。
    1. 選取組態 > 虛擬硬體 > 新增裝置 > PCI 裝置
    2. 從清單中選取所需的 NVIDIA Grid vGPU 裝置。NVIDIA Grid vGPU 設定檔有兩種類型:時間共用多執行個體 GPU 共用。選取裝置時,系統會偵測設定檔。
      備註: 只能向虛擬機器類別新增一個 MIG 設定檔類型的 NVIDIA GRID vGPU 裝置。
    3. 按一下選取新增 PCI 裝置將顯示在「虛擬硬體」索引標籤中。
  7. 對於組態 > 虛擬硬體,為 CPU記憶體新增 PCI 裝置視訊卡安全性裝置指定所需的設定。
    表 1. CPU 組態
    設定 組態
    CPU 選取虛擬機器的虛擬 CPU 數。如需詳細資訊,請參閱虛擬 CPU 組態和限制
    CPU 拓撲 開啟電源時已指派
    保留區 保留必須介於 0 和 10 MHz 之間
    限制 限制必須大於或等於 10 MHz
    共用率 選項包括「低」、「正常」、「高」、「自訂」
    硬體虛擬化 選取此選項,可向客體作業系統公開硬體協助虛擬化
    效能計數器 啟用虛擬化 CPU 效能計數器
    排程相似性 選取此虛擬機器的實體處理器相似性。使用「-」指示範圍,使用「,」分隔值。例如「0, 2, 4-7」指示處理器 0、2、4、5、6 和 7。清除字串以移除相似性設定。
    I/O MMU 選取以啟用記憶體管理單元 (從分頁到磁碟)
    表 2. 記憶體組態
    設定 組態
    記憶體 選取虛擬機器的記憶體大小。如需詳細資訊,請參閱虛擬機器記憶體上限
    保留區 為虛擬機器指定保證配置下限,或保留所有客體記憶體。如果無法滿足保留要求,則虛擬機器將無法執行。
    限制 選取要限制的記憶體數量,以便限制虛擬機器耗用的記憶體。
    共用率 選取要共用的記憶體數量。共用率代表配置記憶體容量的相對度量。如需詳細資訊,請參閱記憶體共用
    記憶體熱插拔 啟用 (核取) 可允許向已開啟電源的虛擬機器新增記憶體資源。如需詳細資料,請參閱記憶體熱新增設定
    表 3. 新增 PCI 裝置 > GPU 共用組態
    時間共用模式 MIG 模式

    在 [時間共用] 模式下,vGPU 排程器指示 GPU 在一段時間內依序為每個啟用了 vGPU 的虛擬機器執行工作,並將盡最大努力平衡各 vGPU 的效能。

    MIG 模式允許多個啟用了 vGPU 的虛擬機器在單一 GPU 裝置上並行執行。如果沒有看到 MIG 選項,表示您選取的 PCI 裝置不支援該選項。

    表 4. 配置視訊卡
    設定 組態
    視訊卡 選擇以自動偵測硬體的設定或輸入自訂設定。如果選取自動偵測,則無法設定其他設定 。
    顯示器數目 選取顯示器數目。
    視訊記憶體總計 輸入視訊記憶體總計 (以 MB 為單位)。
    3D 圖形 選取以啟用 3D 支援。
    表 5. 設定安全性裝置
    [設定] 組態
    安全性裝置 如果安裝了 SGX 安全性裝置,則可以在此處進行虛擬機器設定,否則無法設定此欄位。如需詳細資料,請參閱 SGX 說明文件
  8. 選取組態 > 虛擬機器選項索引標籤,然後進行任何其他虛擬機器設定。請參閱設定虛擬機器選項以取得指引。
  9. 選取組態 > 進階參數索引標籤,然後為虛擬機器類別新增任何屬性。
  10. 下一步
  11. 檢閱並確認頁面上,檢閱詳細資料並按一下完成
  12. 將新虛擬機器類別與 vSphere 命名空間相關聯。請參閱將虛擬機器類別與 vSphere 命名空間 相關聯
圖 1. NVIDIA vGPU 裝置選取
NVIDIA vGPU 裝置選取
圖 2. NVIDIA vGPU 新增 PCI 裝置
NVIDIA vGPU 新增 PCI 裝置

使用 vGPU 設定檔建立自訂虛擬機器類別 (v8 U2 及更早版本)

下一步是建立包含 vGPU 設定檔的自訂虛擬機器類別。系統在建立 TKG 叢集節點時將使用此類別定義。

按照以下說明建立包含 vGPU 設定檔的自訂虛擬機器類別。
  1. 使用 vSphere Client 登入 vCenter Server
  2. 選取工作負載管理
  3. 選取服務
  4. 選取虛擬機器類別
  5. 按一下建立虛擬機器類別
  6. 組態索引標籤上,設定自訂虛擬機器類別。
    組態欄位 說明
    名稱 輸入自訂虛擬機器類別的自描述性名稱,例如 vmclass-vgpu-1
    vCPU 計數 2
    CPU 資源保留 可選,按一下 [確定] 留空
    記憶體 例如 80 GB
    記憶體資源保留 100% (如果在虛擬機器類別中設定了 PCI 裝置,則強制使用此值)
    PCI 裝置
    備註: 針對 PCI 裝置選取 [是] 將告知系統您使用的是 GPU 裝置,並將變更虛擬機器類別組態以支援 vGPU 組態。如需詳細資訊,請參閱 在 vSphere with Tanzu 中將 PCI 裝置新增到虛擬機器類別

    例如:

    ""

  7. 下一步
  8. PCI 裝置索引標籤上選取新增 PCI 裝置 > NVIDIA vGPU 選項。
  9. 設定 NVIDIA vGPU 型號。
    NVIDIA vGPU 欄位 說明
    型號 NVIDIA vGPU > 型號功能表所提供的型號中選取 NVIDIA GPU 硬體裝置型號。如果系統未顯示任何設定檔,表示叢集中的所有主機都不具有受支援的 PCI 裝置。
    GPU 共用

    此設定定義如何在啟用了 GPU 的虛擬機器之間共用 GPU 裝置。vGPU 實作有兩種類型:時間共用多執行個體 GPU 共用

    在 [時間共用] 模式下,vGPU 排程器指示 GPU 在一段時間內依序為每個啟用了 vGPU 的虛擬機器執行工作,並將盡最大努力平衡各 vGPU 的效能。

    MIG 模式允許多個啟用了 vGPU 的虛擬機器在單一 GPU 裝置上並行執行。MIG 模式基於較新的 GPU 架構,僅在 NVIDIA A100 和 A30 裝置上受支援。如果沒有看到 MIG 選項,表示您選取的 PCI 裝置不支援該選項。

    GPU 模式 運算
    GPU 記憶體 例如 8 GB
    vGPU 數目 例如 1

    例如,以下是在 [時間共用] 模式下設定的 NVIDIA vGPU 設定檔:

    [PCI 裝置] 索引標籤,包含在 [時間共用] 模式下設定的 NVIDIA vGPU 設定檔。

    例如,以下是在具有受支援 GPU 裝置的情況下在 MIG 模式下設定的 NVIDIA vGPU 設定檔:

    [PCI 裝置] 索引標籤,包含在 [多執行個體 GPU 共用] 模式下設定的 NVIDIA vGPU 設定檔。

  10. 下一步
  11. 查看並確認您的選擇。
  12. 按一下完成
  13. 驗證虛擬機器類別清單中是否有新的自訂虛擬機器類別。

vGPU 和動態 DirectPath IO

如果要將 vGPU 與動態 DirectPath IO 搭配使用,請完成以下其他組態。將第二個 PCI 裝置組態新增到您建立的自訂虛擬機器類別中,並指定 動態 DirectPath IO,同時選取受支援的 PCI 裝置。具現化此類型的虛擬機器類別時,將由 vSphere Distributed Resource Scheduler (DRS) 確定虛擬機器放置。
  1. 選取工作負載管理
  2. 選取服務
  3. 選取虛擬機器類別
  4. 編輯設定了 NVIDIA vGPU 設定檔的自訂虛擬機器類別。
  5. 選取 PCI 裝置索引標籤。
  6. 按一下新增 PCI 裝置
  7. 選取動態 DirectPath IO 選項。

    ""

  8. 選取 PCI 裝置

    例如:

    ""
  9. 下一步
  10. 查看並確認您的選擇。
  11. 按一下完成
  12. 驗證虛擬機器類別清單中是否有新的自訂虛擬機器類別。