VMware Private AI Foundation with NVIDIA での ML モデルの格納

VMware Cloud Foundation 5.2.1 の VMware Private AI Foundation with NVIDIA 以降、MLOps エンジニアである場合は、中央の Harbor コンテナレジストリを使用してディープラーニング仮想マシンと TKG クラスタ全体に ML モデルを分散できます。

ML モデルに中央モデルギャラリーを使用すると、次の利点があります。

ディープラーニング仮想マシンで検証したモデルを組織内に分散します。インターネット上のモデルは、悪意のあるコードを含むか、悪意のある動作に合わせて調整されている可能性があります。
組織間で継続的に提供を行うか、プラットフォームまたは環境間で提供を促進するためにモデルを分散します。
制御された環境でモデルの整合性を維持します。
Harbor プロジェクトアクセス機能を使用すると、モデルのトレーニングと調整に使用される機密データへのアクセスを制限できます。
メタデータは、ML モデルの内容と依存関係を記述する Open Container Initiative (OCI) 形式で格納します。これにより、ターゲットモデルを実行できるプラットフォームを特定できます。

Harbor を使用して、NVIDIA NGC カタログ、Hugging Face、および別の ML モデルカタログのモデルを格納できます。

モデルギャラリーについて

VMware Private AI Foundation with NVIDIA のモデルギャラリーは、次の構成を持つ Harbor プロジェクトです。

表 1. Harbor の ML モデルギャラリー
モデルギャラリーエンティティ	Harbor または OCI エンティティ	要件
モデルギャラリー	ユーザーアクセスが構成されているプロジェクト	Habor レジストリ内での一意の名前を付ける必要があります。
モデル	OCI リポジトリ	OCI 形式に従ってプロジェクト内での一意の名前を付ける必要があります。
リビジョン	OCI アーティファクト	コンテンツダイジェストによって識別される Immutable マニフェスト。同じモデルデータを複数回プッシュすると、1 つのリビジョンのみが保存されます。モデルデータが変更されると、プッシュ操作ごとに新しいリビジョンが作成されます。モデルリビジョンにタグを付けることができます。コンテナエコシステムとは異なり、サポートされていますが、`latest` タグはモデルをプルするときのデフォルトのオプションではありません。
ファイル	OCI レイヤーと BLOB	-

たとえば、Harbor は Llama モデルのリビジョンの例として次の形式を使用します。

モデルギャラリーへのモデルのプッシュとプル

VMware Private AI Foundation with NVIDIA では、ディープラーニング仮想マシンを使用して、パブリックコンテナレジストリまたは組織内のコンテナレジストリからダウンロードしたモデルを検証および微調整できます。次に、仮想マシンで pais コマンドラインユーティリティを使用して、Harbor 内のモデルギャラリーとの間でモデルをプッシュおよびプルします。

モデル ギャラリーについて

モデル ギャラリーへのモデルのプッシュとプル

モデルギャラリーについて

モデルギャラリーへのモデルのプッシュとプル