Als DevOps-Ingenieur können Sie eine Deep Learning-VM mit einer RAG-Referenzlösung über den Automation Service Broker-Self-Service-Katalog bereitstellen.
Prozedur
- Suchen Sie auf der Seite Katalog in Automation Service Broker nach der Karte KI-RAG-Workstation und klicken Sie auf Anfordern.
- Wählen Sie ein Projekt aus.
- Geben Sie einen Namen und eine Beschreibung für die Bereitstellung ein.
- Konfigurieren Sie die Parameter der RAG-Workstation.
Einstellung Beispielwert VM-Klasse A100 Klein – 1 vGPU (16 GB), 8 CPUs und 16 GB Memory Mindestspezifikation für VM-Klassen:- CPU: 10 vCPUs
- CPU-RAM: 64 GB
- GPU: 2xH100
- GPU-Arbeitsspeicher: 50 GB
Größe der Datenfestplatte 3 Gi Benutzerkennwort Geben Sie ein Kennwort für den Standardbenutzer ein. Sie werden bei der ersten Anmeldung unter Umständen dazu aufgefordert, Ihr Kennwort zurückzusetzen. Öffentlicher SSH-Schlüssel Diese Einstellung ist optional. - Installieren Sie Softwareanpassungen.
- (Optional) Wenn Sie zusätzlich zu der für das RAG-Softwarepaket definierten cloud-init eine benutzerdefinierte cloud-init installieren möchten, aktivieren Sie das Kontrollkästchen und fügen Sie den Inhalt des Konfigurationspakets ein.
VMware Aria Automation führt cloud-init über das RAG-Softwarepaket und die benutzerdefinierte cloud-init zusammen.
- Geben Sie den Schlüssel für den Zugriff auf das NVIDIA NGC-Portal an.
- Geben Sie die Anmeldedaten für den Docker-Hub ein.
- (Optional) Wenn Sie zusätzlich zu der für das RAG-Softwarepaket definierten cloud-init eine benutzerdefinierte cloud-init installieren möchten, aktivieren Sie das Kontrollkästchen und fügen Sie den Inhalt des Konfigurationspakets ein.
- Klicken Sie auf Senden.