VMware Private AI Foundation with NVIDIA にディープ ラーニング仮想マシンを展開すると、NVIDIA vGPU ゲスト ドライバのステータスがライセンスなしになります。
問題
/var/log/vgpu-install.log ファイルに次のいずれかのメッセージが含まれます。
License Status: Unlicensed
Unlicensed (Restricted)
原因
vgpu-license
OVF プロパティまたは
VMware Aria Automation のプライベート AI のカタログ セットアップ ウィザードに値として渡す NVIDIA vGPU クライアント構成トークンが無効、期限切れ、または形式が正しくありません。
解決方法
-
クライアント構成トークンの有効性を確認します。
-
vGPU ライセンスの形式が正しく、JWT トークン形式(通常は
eyxxxx.eyxxxxx.xxxxx
)に従っていることを確認します。jwt.io で JWT トークンをデコードして、有効期限とノード サーバ URL を確認できます。
-
vGPU ライセンス トークンは /etc/nvidia/ClientConfigToken/client_configuration_token.tok にも保存されます。
- 問題をさらにトラブルシューティングするには、次のコマンドを実行して、NVIDIA ライセンス サーバとの通信に関連する特定のエラー メッセージを確認します。
cat /var/log/syslog | grep -i nvidia
- /etc/nvidia/ClientConfigToken/client_configuration_token.tok ファイルの内容を新しいトークンに置き換え、次のコマンドを実行します。
echo -n $vgpu_license_token > /etc/nvidia/ClientConfigToken/client_configuration_token.tok
- NVIDIA サービスを再起動します。
/etc/init.d/nvidia-gridd restart
- NVIDIA vGPU ゲスト ドライバのライセンス ステータスを確認します。
nvidia-smi -q | grep -i "license status" | sed 's/^[ \t]*//'