Dopo aver distribuito un'istanza di Deep Learning VM in VMware Private AI Foundation with NVIDIA, lo stato del driver guest NVIDIA vGPU è Non concesso in licenza.

Problema

Il file /var/log/vgpu-install.log contiene uno dei messaggi seguenti:

License Status: Unlicensed
Unlicensed (Restricted)

Causa

Il token di configurazione del client NVIDIA vGPU passato come valore alla proprietà OVF vgpu-license o alla procedura guidata di configurazione del catalogo per Private AI in VMware Aria Automation non è valido, è scaduto o è formattato in modo errato.

Soluzione

  • Verificare la validità del token di configurazione del client.

  • Verificare che la licenza di vGPU sia formattata correttamente e che segua il formato del token JWT, che in genere ha l'aspetto eyxxxx.eyxxxxx.xxxxx.

    È possibile decrittografare il token JWT in jwt.io per controllare la data di scadenza e l'URL del server del nodo.

  • Il token di licenza di vGPU è stato salvato anche in /etc/nvidia/ClientConfigToken/client_configuration_token.tok.

  • Per risolvere ulteriormente il problema, eseguire questo comando per verificare la presenza di messaggi di errore specifici relativi alla comunicazione con il server delle licenze NVIDIA.
    cat /var/log/syslog | grep -i nvidia
Per applicare un nuovo token, eseguire i passaggi seguenti:
  1. Sostituire il contenuto del file /etc/nvidia/ClientConfigToken/client_configuration_token.tok con un nuovo token ed eseguire il comando seguente:
    echo -n $vgpu_license_token > /etc/nvidia/ClientConfigToken/client_configuration_token.tok
  2. Riavviare il servizio NVIDIA.
    /etc/init.d/nvidia-gridd restart
    
  3. Verificare lo stato della licenza del driver guest NVIDIA vGPU.
    nvidia-smi -q | grep -i "license status" | sed 's/^[ \t]*//'