VMware Aria Automation fornisce supporto per gli elementi catalogo self-service che i tecnici devOps e i data scientist possono utilizzare per eseguire il provisioning dei carichi di lavoro AI in VMware Private AI Foundation with NVIDIA in modo semplice e personalizzabile.

Prerequisiti

In qualità di amministratore del cloud, verificare che l'ambiente VMware Private AI Foundation with NVIDIA sia configurato. Vedere Preparazione di VMware Cloud Foundation per la distribuzione del carico di lavoro di Private AI.

Connessione di VMware Aria Automation a un dominio del carico di lavoro per VMware Private AI Foundation with NVIDIA

Prima di poter aggiungere elementi del catalogo per il provisioning delle applicazioni di intelligenza artificiale utilizzando VMware Aria Automation, connettere VMware Aria Automation a VMware Cloud Foundation.

Procedura

Creazione di elementi catalogo self-service AI in VMware Aria Automation

In qualità di amministratore del cloud, utilizzare la procedura guidata di configurazione del catalogo per Private AI in VMware Aria Automation per aggiungere rapidamente elementi catalogo per la distribuzione di istanze di Deep Learning VM o cluster TKG con accelerazione GPU in un dominio del carico di lavoro VI in VMware Cloud Foundation connesso.

I data scientist possono utilizzare gli elementi catalogo di deep learning per la distribuzione delle macchine virtuali di deep learning. I tecnici DevOps possono utilizzare gli elementi catalogo per il provisioning di cluster TKG pronti per AI.

Ogni volta che viene eseguita, la configurazione guidata del catalogo per Private AI aggiunge elementi per le istanze di Deep Learning VM e i cluster TKG nel catalogo di Service Broker. È possibile eseguire la procedura guidata ogni volta che è necessario:

  • Abilitare il provisioning dei carichi di lavoro AI in un altro supervisore.
  • Apportare una modifica alla licenza NVIDIA AI Enterprise, che include il file .tok per la configurazione del client e il server delle licenze o l'URL di download per i driver guest della vGPU per un ambiente disconnesso.
  • Apportare una modifica all'immagine di una macchina virtuale di deep learning.
  • Utilizzare altre classi di macchine virtuali vGPU o non GPU, un criterio di storage o un registro di container.
  • Creare elementi catalogo in un nuovo progetto.
Nota: VMware Aria Automation crea uno spazio dei nomi vSphere ogni volta che viene eseguito il provisioning di un'istanza di Deep Learning VM o di un cluster Tanzu Kubernetes Grid.

Procedura

Operazioni successive

Utilizzando Automation Service Broker, i data scientist possono procedere con la distribuzione delle istanze di Deep Learning VM e i tecnici DevOps possono procedere con il provisioning di cluster Tanzu Kubernetes Grid abilitati per GPU. Vedere Distribuzione di Deep Learning VM non RAG in VMware Aria Automation.

Creazione di un elemento catalogo di un database vettore in VMware Aria Automation

In qualità di amministratore del cloud, è possibile aggiungere un elemento catalogo per il provisioning dei database di VMware Data Services Manager in Automation Service Broker di VMware Aria Automation.

Prerequisiti

  • Verificare che sia distribuito VMware Data Services Manager 2.1.
  • Specificare una macchina in cui sia installato Python 3.10 che abbia accesso alle istanze di VMware Data Services Manager e VMware Aria Automation.

Procedura

  1. Scaricare il bundle AriaAutomation_DataServicesManager per VMware Data Services Manager 2.1 dal portale tecnico di Broadcom.
    1. Accedere al portale di supporto di Broadcom.
    2. Dal menu a discesa della categoria del software nell'angolo in alto a destra del portale, selezionare VMware Cloud Foundation.


    3. Nel riquadro di navigazione a sinistra fare clic su My Downloads.
    4. Nella pagina My Downloads - VMware Cloud Foundation fare clic su VMware Data Services Manager.
    5. Fare clic sul numero di versione e scaricare il bundle AriaAutomation_DataServicesManager.
  2. Nella macchina che esegue Python, caricare il bundle AriaAutomation_DataServicesManager ed estrarne il contenuto.
  3. Aggiornare il file config.json nella cartella in cui è stato estratto il bundle con gli URL e le credenziali utente per VMware Data Services Manager e VMware Aria Automation.
    Facoltativamente, è anche possibile impostare il nome dell'elemento catalogo, il progetto di Automation Assembler e altri parametri.
  4. Per creare gli elementi catalogo in VMware Aria Automation, eseguire lo script Python aria.py nel modo seguente.
    python3 aria.py enable-blueprint-version-2

risultati

Lo script Python crea in VMware Aria Automation elementi necessari per l'utilizzo di VMware Data Services Manager per il provisioning del database. Vedere il file readme.md nel bundle AriaAutomation_DataServicesManager

Operazioni successive

I data scientist o i tecnici DevOps possono distribuire un database vettore dal catalogo di Automation Service Broker con estensione pgvector e integrarlo nei carichi di lavoro RAG. Vedere Distribuzione di carichi di lavoro RAG in VMware Private AI Foundation with NVIDIA.