您可以使用 vMotion 來執行 由 NVIDIA vGPU 支援的虛擬機器的即時移轉,而不會導致資料遺失。

若要為 vGPU 虛擬機器啟用 vMotion,需要將 vgpu.hotmigrate.enabled 進階設定設為 true。如需有關如何設定 vCenter Server 進階設定的詳細資訊,請參閱 vCenter Server 組態說明文件中的〈設定進階設定〉

在 vSphere 6.7 Update 1 和 vSphere 6.7 Update 2 中,當您使用 vMotion 移轉 vGPU 虛擬機器並且 vMotion 關閉時間超過 100 秒時,對於框架緩衝區大小為 24 GB 或以上的 vGPU 設定檔,移轉程序可能會失敗。若要避免 vMotion 逾時,請升級至 vSphere 6.7 Update 3 或更新版本。

在關閉時間內,您無法存取虛擬機器、桌面或應用程式。一旦移轉完成,對虛擬機器的存取將恢復,且所有應用程式將從先前的狀態繼續。如需 vGPU 設定檔中的框架緩衝區大小的相關資訊,請參閱 NVIDIA 虛擬 GPU 說明文件

下表列出了預期的虛擬機器關閉時間 (即在 vMotion 期間使用者無法存取虛擬機器的時間) 以及預估最差狀況關閉時間。這些預期關閉時間是在 10 Gb 網路上搭配 NVIDIA Tesla V100 PCIe 32 GB GPU 進行測試:

表 1. vGPU 虛擬機器的 vMotion 預期關閉時間
使用的 vGPU 框架緩衝區 (GB) 虛擬機器關閉時間 (秒)
1 2
2 4
4 6
8 12
16 22
32 39
表 2. 預估最差狀況關閉時間 (秒)
vGPU 記憶體 虛擬機器記憶體 4 GB 虛擬機器記憶體 8 GB 虛擬機器記憶體 16 GB 虛擬機器記憶體 32 GB
1 GB 5 6 8 12
2 GB 7 9 11 15
4 GB 13 14 16 21
8 GB 24 25 28 32
16 GB 47 48 50 54
32 GB 91 92 95 99
備註: 考慮預期和預估的最差狀況關閉時間時,請記住以下幾點:
  • 設定的 vGPU 設定檔代表已使用的 vGPU 框架緩衝區的上限。在許多使用案例中,虛擬機器在任何指定時間使用的 vGPU 框架緩衝區記憶體數量低於設定檔中指派的 vGPU 記憶體。
  • 預期和預估的最差狀況關閉時間僅在移轉單一虛擬機器時有效。如果同時移轉多個虛擬機器,即對於 vSphere 手動修復程序,關閉時間將產生不利影響。
  • 上述預估值假設 CPU、記憶體、PCIe 和網路容量足以實現 10 Gbps 移轉輸送量。

DRS 支援初始放置執行 vSphere 6.7 Update 1 及更新版本的 vGPU 虛擬機器,但不支援負載平衡。

僅於使用且於相容的 NVIDIA GPU 裝置型號與 NVIDIA GRID 主機驅動程式版本 (與 NVIDIA 所定義和支援) 之間,才支援使用 VMware vSphere vMotion。如需相容性資訊,請參閱 NVIDIA 虛擬 GPU 使用者指南

若要檢查 NVIDIA vGPU 主機驅動程式、vSphere 和 Horizon 之間的相容性,請參閱 VMware 相容性矩陣圖