Nach der Bereitstellung einer Deep Learning-VM in VMware Private AI Foundation with NVIDIA schlägt das Herunterladen der angegebenen DL-Arbeitslast auf die virtuelle Maschine mit Fehlermeldungen fehl, die auf ungültige Anmeldedaten für die Authentifizierung hindeuten.

Problem

Wenn Sie ein DL-Arbeitslast-Container-Image installieren, wie z. B. Triton Inference Server, TensorFlow oder Pytorch, enthält die Datei /var/log/dl.log folgende Meldung:

Unable to find image 'nvcr.io/nvidia/tritonserver-pb24h1:24.03.02-py3' locally docker: Error response from daemon: unauthorized: <html> <head><title>401 Authorization Required</title></head> <body>

Für NVIDIA RAG enthält die Datei /var/log/dl.log folgende Meldung:

Error: Invalid apikey chmod: cannot access 'llama2-13b-chat_vh100x2_fp16_24.02': No such file or directory Error: Invalid apikey chmod: cannot access 'nv-embed-qa_v4': No such file or directory stat /opt/data/rag-docker-compose_v24.03/docker-compose-vectordb.yaml: no such file or directory stat /opt/data/rag-docker-compose_v24.03/rag-app-text-chatbot.yaml: no such file or directory

Ursache

Die Authentifizierung bei der Containerregistrierung vom Typ „nvcr.io“ ist fehlgeschlagen. Folglich kann das DL-Arbeitslast-Image nicht auf die virtuelle Maschine heruntergeladen werden.

Lösung

  • Überprüfen Sie die Anmeldedaten für die Anmeldung bei der als OVF-Parameter übergebenen Registrierung vom Typ „nvcr.io“ oder beim Assistenten für die Katalogeinrichtung für Private AI in VMware Aria Automation.

    • Registrierung: nvcr.io
    • Benutzerkonto für Registrierung: $oauthtoken
    • Registrierungskennwort: API-Schlüssel des NGC-Portals
  • Stellen Sie sicher, dass der API-Schlüssel des NVIDIA NGC-Portals über die Berechtigungen zum Zugriff auf die erforderlichen Ressourcen verfügt und dass der Schlüssel nicht abgelaufen ist.