切断された VMware Private AI Foundation with NVIDIA 環境で kubectl コマンドを使用して GPU アクセラレーション TKG クラスタをプロビジョニングする

VMware Private AI Foundation with NVIDIA では、DevOps エンジニアが Kubernetes API を使用して、NVIDIA GPU を使用する TKG クラスタをプロビジョニングします。切断された環境では、ローカルの Ubuntu パッケージリポジトリを追加でセットアップし、スーパーバイザーの Harbor レジストリを使用する必要があります。

前提条件

クラウド管理者に、AI 対応インフラストラクチャのための次の前提条件が満たされていることを確認します。

VMware Private AI Foundation with NVIDIA が展開および構成されている。VMware Private AI Foundation with NVIDIA の展開を参照してください。
Ubuntu TKr イメージを含むコンテンツライブラリが AI ワークロードの名前空間に追加されている。切断された VMware Private AI Foundation with NVIDIA 環境用に Ubuntu TKr でコンテンツライブラリを構成するを参照してください。
スーパーバイザーエンドポイントにアクセスできるマシン。

手順

クラウド管理者が構成した vSphere 名前空間に TKG クラスタをプロビジョニングします。
「NVIDIA vGPU 用の TKGS クラスタのプロビジョニング」を参照してください。
TKG クラスタのセットアップを完了します。
「VMware vSphere with VMware Tanzu（エアギャップ）のインストール」を参照してください。
1. ローカルの Ubuntu パッケージリポジトリを指定し、NVIDIA GPU Operator パッケージ内のコンテナイメージをスーパーバイザーの Harbor レジストリにアップロードします。
2. NVIDIA GPU Operator の Helm チャート定義を更新して、ローカルの Ubuntu パッケージリポジトリとプライベート Harbor レジストリを使用します。
3. NVIDIA ライセンス情報を指定します。
4. NVIDIA GPU Operator をインストールします。

次に行うこと

スーパーバイザーの Harbor レジストリから AI コンテナイメージを展開します。