En tant qu'ingénieur DevOps, vous pouvez déployer une VM à apprentissage profond avec une solution de référence RAG à partir du catalogue Automation Service Broker en libre-service.
Procédure
- Sur la page Catalogue dans Automation Service Broker, recherchez la carte Station de travail RAG d'IA et cliquez sur Demander.
- Sélectionnez un projet.
- Entrez un nom et une description pour le déploiement.
- Configurez les paramètres de la station de travail RAG.
Paramètre Exemple de valeur Classe de VM A100 petit - 1 vGPU (16 Go), 8 CPU et 16 Go de mémoire Spécifications minimales de classe de VM :- CPU : 10 vCPU
- RAM de CPU : 64 Go
- GPU : 2xH100
- Mémoire du GPU : 50 Go
Taille du disque de données 3 Gi Mot de passe utilisateur Entrez un mot de passe pour l'utilisateur par défaut. Vous pouvez être invité à réinitialiser votre mot de passe lorsque vous vous connectez pour la première fois. Clé publique SSH Ce paramètre est facultatif. - Installez les personnalisations logicielles.
- (Facultatif) Si vous souhaitez installer un script cloud-init personnalisé en plus du script cloud-init défini pour le bundle de logiciels RAG, cochez la case et collez le contenu du module de configuration.
VMware Aria Automation combine le script cloud-init entre le bundle de logiciels RAG et le script cloud-init personnalisé.
- Fournissez votre clé d'accès au portail NVIDIA NGC.
- Entrez les informations d'identification de Docker Hub.
- (Facultatif) Si vous souhaitez installer un script cloud-init personnalisé en plus du script cloud-init défini pour le bundle de logiciels RAG, cochez la case et collez le contenu du module de configuration.
- Cliquez sur Envoyer.