Si el administrador de nube configuró Private AI Automation Services en VMware Aria Automation, puede acceder y solicitar cargas de trabajo de AI mediante el catálogo de Automation Service Broker.
- AI Workstation: una máquina virtual habilitada para GPU que se puede configurar con la vCPU, vGPU y memoria que se quiera y la opción de preinstalar marcos de AI/ML como PyTorch, muestras de CUDA y TensorFlow.
- AI RAG Workstation: una máquina virtual habilitada para GPU con solución de referencia Recovery Augmented Generation (RAG).
- Servidor de inferencias Triton: una máquina virtual habilitada para GPU con servidor de inferencias Triton de NVIDIA.
- Clúster de AI Kubernetes: un clúster de VMware Tanzu Kubernetes Grid con nodos de trabajo compatibles con GPU para ejecutar cargas de trabajo nativas de la nube de AI/ML.
- Clúster RAG de Kubernetes AI: un clúster de VMware Tanzu Kubernetes Grid con nodos de trabajo compatibles con GPU para ejecutar una solución RAG de referencia.
Antes de comenzar
- Compruebe que el administrador de nube ha configurado Private AI Automation Services para su proyecto.
- Compruebe que tiene permisos para solicitar elementos del catálogo de AI.
¿Cómo acceder a los elementos de catálogo de Private AI Automation Services?
En Automation Service Broker, abra la pestaña Consumo y, a continuación, haga clic en Catálogo. Los elementos del catálogo que tendrá disponibles dependerán del proyecto seleccionado. Si no seleccionó ningún proyecto, se muestran en el catálogo todos los elementos del catálogo que están disponibles para usted.
Recuerde que todos los valores que se muestran en los procedimientos descritos en esta sección son ejemplos de casos prácticos. Los valores de su cuenta dependen del entorno que tenga.
Cómo supervisar las implementaciones de mi Private AI
Utilice la página Implementaciones de Automation Service Broker para administrar las implementaciones y los recursos asociados, realizar cambios en ellas, solucionar los problemas de las implementaciones con errores, hacer cambios en los recursos y destruir las implementaciones que no se utilizan.
Para administrar las implementaciones, seleccione
.Para obtener más información, consulte Cómo administrar mis implementaciones de Automation Service Broker.