Dopo aver distribuito un'istanza di Deep Learning VM in VMware Private AI Foundation with NVIDIA, lo stato del driver guest NVIDIA vGPU è Non concesso in licenza.
Problema
Il file /var/log/vgpu-install.log contiene uno dei messaggi seguenti:
License Status: Unlicensed
Unlicensed (Restricted)
Causa
vgpu-license
o alla procedura guidata di configurazione del catalogo per Private AI in
VMware Aria Automation non è valido, è scaduto o è formattato in modo errato.
Soluzione
-
Verificare la validità del token di configurazione del client.
-
Verificare che la licenza di vGPU sia formattata correttamente e che segua il formato del token JWT, che in genere ha l'aspetto
eyxxxx.eyxxxxx.xxxxx
.È possibile decrittografare il token JWT in jwt.io per controllare la data di scadenza e l'URL del server del nodo.
-
Il token di licenza di vGPU è stato salvato anche in /etc/nvidia/ClientConfigToken/client_configuration_token.tok.
- Per risolvere ulteriormente il problema, eseguire questo comando per verificare la presenza di messaggi di errore specifici relativi alla comunicazione con il server delle licenze NVIDIA.
cat /var/log/syslog | grep -i nvidia
- Sostituire il contenuto del file /etc/nvidia/ClientConfigToken/client_configuration_token.tok con un nuovo token ed eseguire il comando seguente:
echo -n $vgpu_license_token > /etc/nvidia/ClientConfigToken/client_configuration_token.tok
- Riavviare il servizio NVIDIA.
/etc/init.d/nvidia-gridd restart
- Verificare lo stato della licenza del driver guest NVIDIA vGPU.
nvidia-smi -q | grep -i "license status" | sed 's/^[ \t]*//'