VMware Private AI Foundation with NVIDIA にディープ ラーニング仮想マシンを展開した後、指定された DL ワークロードを仮想マシンにダウンロードすると失敗し、認証情報が無効であるというエラー ログ メッセージが表示されます。
問題
Triton Inference Server、TensorFlow、Pytorch などの DL ワークロード コンテナ イメージをインストールする場合、/var/log/dl.log ファイルには次のメッセージが含まれます。
Unable to find image 'nvcr.io/nvidia/tritonserver-pb24h1:24.03.02-py3' locally docker: Error response from daemon: unauthorized: <html> <head><title>401 Authorization Required</title></head> <body>
NVIDIA RAG の場合、/var/log/dl.log ファイルに次のメッセージが含まれます。
デーモンからのエラー応答:Get "https://nvcr.io/v2/": unauthorized。
原因
nvcr.io コンテナ レジストリへの認証に失敗しました。その結果、DL ワークロード イメージを仮想マシンにダウンロードできなくなります。
解決方法
-
OVF パラメータとして渡された、または VMware Aria Automation のプライベート AI のカタログ セットアップ ウィザードに渡された、nvcr.io レジストリにログインするための認証情報を確認します。
- レジストリ:nvcr.io
- レジストリ ユーザー アカウント:$oauthtoken
- レジストリ パスワード:NGC ポータルの API キー
-
NVIDIA NGC ポータル API キーに必要なリソースにアクセスする権限があり、キーの有効期限が切れていないことを確認します。