ワークフローの例: ML モデルの検証とモデルギャラリーへのアップロード

MLOps エンジニアである場合は、組織のセキュリティ、プライバシー、および技術要件に対してオンボーディングされた ML モデルを検証します。その後、モデルを専用のモデルギャラリーにアップロードして、AI アプリケーション開発者または MLOps エンジニアがモデルランタイムの自動 CI/CD ベースの展開に使用できます。

手順

Triton Inference Server を備えたディープラーニング仮想マシンを展開し、vmware として SSH 接続を開きます。

次のワークフローのいずれかを使用できます。MLOps エンジニアである場合は、VMware Aria Automation からデータベースを直接展開できます。展開できない場合は、クラウド管理者または DevOps エンジニアに仮想マシンの展開をリクエストします。


展開のワークフロー	必要なユーザーロール	説明
VMware Aria Automation のセルフサービスカタログアイテムを使用して展開する	MLOps エンジニア	VMware Aria Automation のセルフサービスカタログアイテムを使用して、NVIDIA Triton Inference Server を備えたディープラーニング仮想マシンを展開するを参照してください。
vSphere クラスタに直接展開します。	クラウド管理者	VMware Private AI Foundation with NVIDIA の vSphere クラスタにディープラーニング仮想マシンを直接展開するを参照してください。
`kubectl` コマンドを使用して展開します。	DevOps エンジニア	kubectl コマンドを使用して VMware Private AI Foundation with NVIDIA でディープラーニング仮想マシンを展開するを参照してください。

モデルが Hugging Face でホストされている場合は、cloud-init スクリプトの一部として huggingface-cli コマンドユーティリティをインストールし、それを使用して、Hugging Face Hub でホストされているオープンウェイトモデルをダウンロードできます。 --local-dir フラグを使用してシンボリックリンクなしでモデルをダウンロードし、 pais CLI がモデルを処理できるようにします。

Harbor レジストリの発行者証明書を、ディープラーニング仮想マシンの証明書トラストストアに追加します。
1. Harbor レジストリ管理者に CA 証明書をリクエストします。
2. 証明書を仮想マシンにアップロードします。たとえば、ワークステーションでセキュアコピープロトコル (scp) クライアントを使用します。
  例：
```
scp infra/my-harbor-issuing-ca.crt [email protected]:
```
3. 証明書を /usr/local/share/ca-certificates ディレクトリにコピーし、トラストストアに追加します。
  例：
```
sudo cp my-harbor-issuing-ca.crt /usr/local/share/ca-certificates/
sudo update-ca-certificates
```
4. 変更を保存するには、Docker サービスを再起動します。
```
sudo systemctl restart docker
```
NVIDIA NGC カタログ、Hugging Face、または別のモデルハブから、検証するモデルをディープラーニング仮想マシンにダウンロードします。
ディープラーニング仮想マシンで、サンドボックスとしてランタイムテストを実行します。
1. モデルファイルのハッシュコードを確認して、モデルの整合性を検証します。
2. モデルファイルをスキャンして、マルウェアを検出します。
3. モデルをスキャンして、シリアライズ攻撃を検出します。
4. Triton Inference Server を使用して、推論が期待どおりに動作することを検証します。
  Triton Inference Serverを参照してください。
5. ビジネスの使用事例に対するモデルのパフォーマンスと安全性を評価します。
  たとえば、悪意のある動作の推論リクエストを調べ、ハンズオン機能テストを実行できます。
docker login を使用して Harbor レジストリにログインします。
```
docker login -u my_harbor_user_name my-harbor-repo-mycompany.com
```
モデルファイルを含むディレクトリから、ターゲット組織の Harbor プロジェクトにモデルをプッシュします。
たとえば、Beijing Academy of Artificial Intelligence (BAAI) から AI アプリケーション開発者向けのストアに bge-small-en-v1.5 モデルをアップロードするには、次の手順を実行します。
```
cd ./baai/bge-small-en-v1.5
pais models push --modelName baai/bge-small-en-v1.5 --modelStore my-harbor-repo-mycompany.com/dev-models --tag approved
```
同じ modelName に再度プッシュすると、モデルの新しいリビジョンが作成され、ユーザーの好みに応じてタグ付けできます。各リビジョンには、整合性を維持するための一意のダイジェストが割り当てられます。
モデルギャラリーで使用可能なモデルを一覧表示し、モデルがアップロードされたかどうかを確認します。
```
pais models list --modelStore my-harbor-repo-mycompany.com/dev-models
```

次のタスク

pais コマンドラインユーティリティをディープラーニング仮想マシンインスタンスで使用することで、モデルギャラリー間でモデルをコピーして、組織全体または機能領域で使用できるようにします。