VMware Private AI Foundation with NVIDIA にディープ ラーニング仮想マシンを展開すると、NVIDIA vGPU ゲスト ドライバのステータスがライセンスなしになります。

問題

/var/log/vgpu-install.log ファイルに次のいずれかのメッセージが含まれます。

License Status: Unlicensed
Unlicensed (Restricted)

原因

vgpu-license OVF プロパティまたは VMware Aria Automation のプライベート AI のカタログ セットアップ ウィザードに値として渡す NVIDIA vGPU クライアント構成トークンが無効、期限切れ、または形式が正しくありません。

解決方法

  • クライアント構成トークンの有効性を確認します。

  • vGPU ライセンスの形式が正しく、JWT トークン形式(通常は eyxxxx.eyxxxxx.xxxxx)に従っていることを確認します。

    jwt.io で JWT トークンをデコードして、有効期限とノード サーバ URL を確認できます。

  • vGPU ライセンス トークンは /etc/nvidia/ClientConfigToken/client_configuration_token.tok にも保存されます。

  • 問題をさらにトラブルシューティングするには、次のコマンドを実行して、NVIDIA ライセンス サーバとの通信に関連する特定のエラー メッセージを確認します。
    cat /var/log/syslog | grep -i nvidia
新しいトークンを適用するには、次の手順を実行します。
  1. /etc/nvidia/ClientConfigToken/client_configuration_token.tok ファイルの内容を新しいトークンに置き換え、次のコマンドを実行します。
    echo -n $vgpu_license_token > /etc/nvidia/ClientConfigToken/client_configuration_token.tok
  2. NVIDIA サービスを再起動します。
    /etc/init.d/nvidia-gridd restart
    
  3. NVIDIA vGPU ゲスト ドライバのライセンス ステータスを確認します。
    nvidia-smi -q | grep -i "license status" | sed 's/^[ \t]*//'