Als uw cloudbeheerder Private AI Automation Services in VMware Aria Automation heeft ingesteld, kunt u AI-workloads aanvragen via de Automation Service Broker-catalogus.
Private AI Automation Services ondersteunen twee catalogusitems in Automation Service Broker waartoe gebruikers met de respectieve rechten toegang hebben en die ze kunnen aanvragen.
- AI-workstation – Een virtuele machine met GPU-functionaliteit die kan worden geconfigureerd met gewenste vCPU, vGPU, geheugen en AI/ML-software van NVIDIA.
- AI Kubernetes-cluster – Een Tanzu Kubernetes-cluster met GPU-functionaliteit dat kan worden geconfigureerd met een NVIDIA GPU-operator.
Voordat u begint
- Controleer of Private AI Automation Services voor uw project zijn geconfigureerd en dat u rechten heeft om AI-catalogusitems aan te vragen.
Vergeet niet dat alle waarden hier voorbeelden zijn voor gebruiksscenario's. Uw accountwaarden zijn afhankelijk van uw omgeving.
Een deeplearning-VM implementeren in een VI-workloaddomein
Als datatechnicus kunt u een softwaregedefinieerde ontwikkelingsomgeving met een GPU implementeren vanuit de selfservicecatalogus van Automation Service Broker. U kunt de virtuele machine met GPU-functionaliteit met machineparameters aanpassen om ontwikkelingsvereisten te modelleren, de AI/ML-softwareconfiguraties opgeven om te voldoen aan trainings- en deductievereisten, en de AI/ML-pakketten van het NVIDIA NGC-register opgeven via een toegangssleutel van de portal.
Procedure
Een AI-compatibel Tanzu Kubernetes-cluster implementeren
Als DevOps-engineer kunt u een voor Tanzu Kubernetes-cluster met GPU-functionaliteit aanvragen, waar werkerknooppunten AI/ML-workloads kunnen uitvoeren.
Het TKG-cluster bevat een NVIDIA GPU-operator, d.i. een Kubernetes-operator die verantwoordelijk is voor het instellen van het juiste NVIDIA-stuurprogramma voor de NVIDIA GPU-hardware op de TKG-clusterknooppunten. Het geïmplementeerde cluster is gebruiksklaar voor AI/ML-workloads zonder dat aanvullende GPU-gerelateerde configuratie nodig is.
Procedure
- Zoek de kaart AI Kubernetes-cluster en klik op Aanvragen.
- Selecteer een project.
- Voer een naam en een beschrijving in voor uw implementatie.
- Selecteer het aantal knooppunten in het controlevenster.
Instelling Voorbeeldwaarde Aantal knooppunten 1 VM-klasse cpu-alleen-medium - 8 CPU's en 16 GB geheugen In de klasseselectie worden de resources gedefinieerd die beschikbaar zijn op de virtuele machine.
- Selecteer het aantal werkknooppunten.
Instelling Beschrijving Aantal knooppunten 3 VM-klasse a100-medium - 4 vGPU (64 GB), 16 CPU's en 32 GB geheugen - Klik op Verzenden.
resultaten
De implementatie bevat een supervisornaamruimte, een TKG-cluster met drie werkknooppunten, meerdere resources binnen het TKG-cluster en een carvel-applicatie die de GPU-operatorapplicatie implementeert.
Uw Private AI-implementaties
U gebruikt de pagina Implementaties om uw implementaties en de gekoppelde resources te beheren, wijzigingen in implementaties aan te brengen, problemen met mislukte implementaties op te lossen, wijzigingen in resources aan te brengen en ongebruikte implementaties te vernietigen.
Om uw implementaties te beheren, selecteert u
.Zie Hoe beheer ik mijn Automation Service Broker-implementaties voor meer informatie.