Si votre administrateur de cloud a configuré Private AI Automation Services dans VMware Aria Automation, vous pouvez y accéder et demander des charges de travail d'IA à l'aide du catalogue Automation Service Broker.
- AI Workstation : machine virtuelle prenant en charge les GPU qui peut être configurée avec le vCPU, le vGPU et la mémoire souhaités, et l'option permettant de préinstaller les infrastructures AI/ML, telles que PyTorch, les exemples CUDA et TensorFlow.
- AI RAG Workstation : machine virtuelle prenant en charge les GPU avec la solution de référence de génération augmentée par récupération (RAG, Retrieval Augmented Generation).
- Triton Inference Server : machine virtuelle prenant en charge les GPU avec NVIDIA Triton Inference Server.
- Cluster Kubernetes AI : cluster VMware Tanzu Kubernetes Grid avec des nœuds worker compatibles avec le GPU pour exécuter des charges de travail cloud natives AI/ML.
- AI Kubernetes RAG Cluster : cluster VMware Tanzu Kubernetes Grid avec des nœuds worker compatibles avec le GPU pour exécuter une solution RAG de référence.
Avant de commencer
- Vérifiez que votre administrateur de cloud a activé Private AI Automation Services pour votre projet.
- Vérifiez que vous disposez des autorisations pour demander des éléments de catalogue d'IA.
Comment accéder aux éléments du catalogue Private AI Automation Services ?
Dans Automation Service Broker, ouvrez l'onglet Consommer, puis cliquez sur Catalogue. Les éléments de catalogue sont disponibles en fonction du projet que vous avez sélectionné. Si vous n'avez pas sélectionné de projet, tous les éléments du catalogue disponibles s'affichent dans le catalogue.
N'oubliez pas que toutes les valeurs indiquées dans les procédures décrites dans cette section sont des exemples de cas d'utilisation. Les valeurs de votre compte dépendent de votre environnement.
Comment surveiller mes déploiements de Private AI ?
Utilisez la page Déploiements dans Automation Service Broker pour gérer vos déploiements et les ressources associées, apporter des modifications aux déploiements, assurer le dépannage des échecs de déploiement, effectuer des modifications sur les ressources et détruire les déploiements inutilisés.
Pour gérer vos déploiements, sélectionnez
.Pour plus d'informations, reportez-vous à la section Gestion de mes déploiements Automation Service Broker.