Dopo aver distribuito Deep Learning VM in VMware Private AI Foundation with NVIDIA, il download del carico di lavoro DL specificato nella macchina virtuale non riesce e nel file di log vengono visualizzati messaggi di errore che indicano che le credenziali di autenticazione non sono valide.

Problema

Se si installa un'immagine del container del carico di lavoro DL, ad esempio Triton Inference Server, TensorFlow o Pytorch, il file /var/log/dl.log contiene il messaggio seguente:

Unable to find image 'nvcr.io/nvidia/tritonserver-pb24h1:24.03.02-py3' locally docker: Error response from daemon: unauthorized: <html> <head><title>401 Authorization Required</title></head> <body>

Per NVIDIA RAG, il file /var/log/dl.log contiene il messaggio seguente:

Error: Invalid apikey chmod: cannot access 'llama2-13b-chat_vh100x2_fp16_24.02': No such file or directory Error: Invalid apikey chmod: cannot access 'nv-embed-qa_v4': No such file or directory stat /opt/data/rag-docker-compose_v24.03/docker-compose-vectordb.yaml: no such file or directory stat /opt/data/rag-docker-compose_v24.03/rag-app-text-chatbot.yaml: no such file or directory

Causa

L'autenticazione nel registro del container nvcr.io non è riuscita. Di conseguenza, l'immagine del carico di lavoro DL non può essere scaricata nella macchina virtuale.

Soluzione

  • Verificare le credenziali per l'accesso al registro nvcr.io passate come parametri OVF o alla procedura guidata di configurazione del catalogo per Private AI in VMware Aria Automation.

    • Registro: nvcr.io
    • Account utente del registro: $oauthtoken
    • Password del registro: NGC portal API key
  • Verificare che la chiave API del portale NVIDIA NGC disponga delle autorizzazioni per accedere alle risorse necessarie e che la chiave non sia scaduta.