NVIDIA NGC カタログのコンテナ イメージのローカル レジストリとして Harbor を使用できます。

注: スーパーバイザーに Harbor サービスをインストールするには、インターネット接続が必要です。

Harbor レジストリとスーパーバイザーの統合を使用する場合は、次のセットアップ方法に従います。

注: ディープ ラーニング仮想マシンまたは TKG クラスタに展開する NVIDIA NGC コンテナをホストするために十分なストレージ領域を割り当てます。ストレージ領域には、各コンテナの少なくとも 3 つのバージョンを格納します。

Harbor サービスのインストール中または接続された Harbor レジストリの設定中にインターネットに接続することが組織にとってのオプションでない場合は、別のベンダーのコンテナ レジストリを使用します。

VMware Private AI Foundation with NVIDIA のプライベート Harbor レジストリに AI コンテナ イメージをアップロードする

AI 対応のスーパーバイザーでのみ Harbor レジストリを使用する切断された環境では、ディープ ラーニング仮想マシンまたは TKG クラスタに展開する AI コンテナ イメージを NVIDIA NGC カタログから Harbor に手動でアップロードする必要があります。

手順

  1. NVIDIA NGC および切断された VMware Cloud Foundation インスタンスにアクセスするマシンで、Harbor レジストリの証明書を使用して Docker クライアントを構成します。
  2. NVIDIA NGC にログインします。
    予約済みのユーザー名 $oauthtoken を使用して、パスワード フィールドに API キーを貼り付けます。
    docker login nvcr.io
  3. 必要なコンテナ イメージを NVIDIA NGC カタログにアクセスできるマシンにプルし、アーカイブに保存します。
    たとえば、CUDA サンプル コンテナをダウンロードするには、次のコマンドを実行します。
    docker pull nvcr.io/nvidia/k8s/cuda-sample:vectoradd-cuda11.7.1-ubi8
    docker save > cuda-sample.tar nvcr.io/nvidia/k8s/cuda-sample:vectoradd-cuda11.7.1-ubi8
  4. ローカル コンテナ レジストリにアクセスできるマシンにアーカイブをコピーします。
  5. ローカル コンテナ レジストリにアクセスできるマシンで、コンテナ イメージをロードします。
    docker load < cuda-sample.tar
  6. コンテナ イメージを Harbor レジストリにプッシュします。

接続されたレジストリのレプリカとして VMware Private AI Foundation with NVIDIA に Harbor レジストリを作成する

NVIDIA NGC カタログの最新のイメージに簡単に更新できるようにするには、別の VI ワークロード ドメインまたは VMware Cloud Foundation インスタンスにあり、インターネットに接続できるスーパーバイザーで Harbor レジストリを使用できます。次に、この接続されたレジストリを AI ワークロードを実行するスーパーバイザーに複製します。

最新のコンテナ イメージを NVIDIA NGC から接続された Harbor レジストリにプルし、プロキシキャッシュ接続を使用して切断されたレジストリに転送します。この方法により、コンテナ イメージをダウンロードして、頻繁に手動でアップロードする必要がなくなります。

注: 別のベンダーによって接続されたコンテナ レジストリを使用することもできます。

2 つのレジストリ間のネットワークは、次の方法で設定します。

  • 接続されたレジストリは、レプリカ レジストリにルーティング可能です。
  • 接続されたレジストリは DMZ に配置され、2 つのレジストリ間で docker pushdocker pull の通信のみが許可されます。

前提条件

GPU 対応ワークロード ドメインのスーパーバイザーで スーパーバイザー サービスとしての Harbor の有効化を行う。

手順

  1. 接続された Harbor レジストリ ユーザー インターフェイスに Harbor システム管理者としてログインします。
  2. [管理] > [レジストリ] ページに移動して、[Docker レジストリ] プロバイダを選択し、NVIDIA NGC API キーを使用して、NVIDIA NGC カタログ nvcr.io/nvaie のエンドポイントを作成します。
  3. [管理] > [プロジェクト] ページに移動し、nvcr.io/nvaie のエンドポイントに接続されたプロキシキャッシュ プロジェクトを作成します。
  4. [レジストリ] ページに戻り、切断されたレジストリのレプリケーション エンドポイントを作成して、[Harbor] プロバイダを選択します。
  5. [管理] > [レプリケーション] ページに移動し、レプリケーション ルールを作成します。
    • プッシュベースのレプリケーション モードを使用します。
    • [宛先レジストリ] プロパティに、AI 対応スーパーバイザー上の切断されたレジストリの URL を入力します。
    • 組織の要件に応じて、フィルタ、ターゲット名前空間、トリガ モードを設定します。

次のタスク

  1. Docker クライアント マシンで docker pull を実行して、組織に必要なコンテナ イメージを NVIDIA NGC から接続されたレジストリにプルします。
  2. レプリケーション ルールに手動トリガ モードがある場合は、必要に応じて手動でレプリケーションを実行します。