Après le déploiement d'une VM à apprentissage profond dans VMware Private AI Foundation with NVIDIA, le téléchargement de la charge de travail DL spécifiée sur la machine virtuelle échoue avec des messages de journal d'erreur indiquant des informations d'identification d'authentification non valides.

Problème

Si vous installez une image de conteneur de charge de travail DL, telle que Serveur d'inférence Triton, TensorFlow ou Pytorch, le fichier /var/log/dl.log contient le message suivant :

Unable to find image 'nvcr.io/nvidia/tritonserver-pb24h1:24.03.02-py3' locally docker: Error response from daemon: unauthorized: <html> <head><title>401 Authorization Required</title></head> <body>

Pour NVIDIA RAG, le fichier /var/log/dl.log contient le message suivant :

Error: Invalid apikey chmod: cannot access 'llama2-13b-chat_vh100x2_fp16_24.02': No such file or directory Error: Invalid apikey chmod: cannot access 'nv-embed-qa_v4': No such file or directory stat /opt/data/rag-docker-compose_v24.03/docker-compose-vectordb.yaml: no such file or directory stat /opt/data/rag-docker-compose_v24.03/rag-app-text-chatbot.yaml: no such file or directory

Cause

L'authentification sur le registre de conteneur nvcr.io a échoué. Par conséquent, vous ne pouvez pas télécharger l'image de charge de travail DL sur la machine virtuelle.

Solution

  • Vérifiez les informations d'identification pour la connexion au registre nvcr.io transmises comme paramètres OVF ou à l'assistant de configuration du catalogue pour Private AI dans VMware Aria Automation.

    • Registre : nvcr.io
    • Compte d'utilisateur du registre : $oauthtoken
    • Mot de passe du registre : NGC portal API key
  • Vérifiez que la clé API du portail NVIDIA NGC dispose des autorisations nécessaires pour accéder aux ressources requises et que la clé n'a pas expiré.