VMware Private AI Foundation with NVIDIA の vSphere クラスタにディープラーニング仮想マシンを直接展開する

VMware Private AI Foundation with NVIDIA のディープラーニング仮想マシンテンプレートをデータサイエンティストがすばやくテストできるようにするには、クラウド管理者が vSphere Client を使用してディープラーニング仮想マシンを vSphere クラスタに直接展開できます。

VMware Private AI Foundation with NVIDIA のディープラーニング仮想マシンイメージの詳細については、「 VMware Private AI Foundation with NVIDIA のディープラーニング仮想マシンイメージについて」を参照してください。

NVIDIA RAG を備えたディープラーニング仮想マシンを展開するには、ベクターデータベースが必要です。VMware Data Services Manager では、pgvector を備えた PostgreSQL データベースを使用できます。このようなデータベースを展開し、ディープラーニング仮想マシンに統合する方法については、「RAG ワークロードでディープラーニング仮想マシンを展開する」を参照してください。

前提条件

VMware Private AI Foundation with NVIDIA がデプロイされ、構成されていることを確認します。プライベート AI ワークロード展開のための VMware Cloud Foundation の準備を参照してください。

手順

VI ワークロードドメインの vCenter Server インスタンスにログインします。
vSphere Client のホームメニューから、[コンテンツライブラリ] を選択します。
コンテンツライブラリのディープラーニング仮想マシンイメージに移動します。
OVF テンプレートを右クリックして、[このテンプレートから仮想マシンを新規作成] を選択します。
表示されるウィザードの [名前とフォルダの選択] ページで、名前を入力して仮想マシンフォルダを選択し、[この仮想マシンのハードウェアをカスタマイズ] を選択して、[次へ] をクリックします。
VI ワークロードドメインで GPU 対応クラスタを選択し、展開の完了後に仮想マシンをパワーオンする必要があるかどうかを選択して、[次へ] をクリックします。
ウィザードに従ってクラスタのデータストアと Distributed Switch 上のネットワークを選択します。
[テンプレートのカスタマイズ] ページで、AI 機能の設定に必要なカスタムの仮想マシンプロパティを入力し、[次へ] をクリックします。
ディープラーニング仮想マシンの OVF プロパティを参照してください。
[ハードウェアのカスタマイズ] ページで、NVIDIA vGPU デバイスを仮想マシンに [新しい PCI デバイス] として割り当て、[次へ] をクリックします。

NVIDIA RAG を実行しているディープラーニング仮想マシンの場合は、タイムスライスモードのフルサイズ vGPU プロファイルまたは MIG プロファイルを選択します。たとえば、vGPU タイムスライスモードの NVIDIA A100 40GB の場合は、[nvidia_a100-40c] を選択します。
NVIDIA RAG を実行しているディープラーニング仮想マシン、または TensorRT バックエンドを備えた Triton Inference Server を使用しているディープラーニング仮想マシンの場合は、仮想マシン設定の [詳細パラメータ] タブで、pciPassthru<vgpu-id>.cfg.enable_uvm パラメータを 1 に設定します。

ここで、<vgpu-id> は仮想マシンに割り当てられた vGPU を識別します。たとえば、2 つの vGPU が仮想マシンに割り当てられている場合は、pciPassthru0.cfg.parameter=1 と pciPassthru1.cfg.parameter = 1 を設定します。

重要：この構成により、ディープラーニング仮想マシンの vSphere vMotion 移行がオフになります。
展開の仕様を確認し、[完了] をクリックします。

結果

ディープラーニング仮想マシンを初めて起動すると、vGPU ゲストドライバと指定されたディープラーニングワークロードがインストールされます。

ログを調べたり、一部のイメージに付属している JupyterLab インスタンスを開いたりできます。アクセスの詳細を組織内のデータサイエンティストと共有できます。VMware Private AI Foundation with NVIDIA のディープラーニングワークロードを参照してください。

次のタスク

SSH 経由でディープラーニング仮想マシンに接続し、すべてのコンポーネントがインストールされ、期待どおりに実行されていることを確認します。
アクセスの詳細をデータサイエンティストに送信します。