VMware vSphere Bitfusion virtualiza los aceleradores de hardware, como las unidades de procesamiento gráfico (GPU), para proporcionar un grupo de recursos compartidos y accesibles a la red que sean compatibles con las cargas de trabajo de inteligencia artificial (AI) y aprendizaje automático (ML).
Qué es la arquitectura de vSphere Bitfusion
vSphere Bitfusion tiene una arquitectura de cliente-servidor. El producto permite que varias máquinas virtuales de cliente (VM) que ejecuten aplicaciones de inteligencia artificial (AI) y aprendizaje automático (ML) compartan el acceso a las GPU remotas en máquinas virtuales que ejecuten el software de servidor de vSphere Bitfusion. Las aplicaciones se ejecutan en los equipos cliente de vSphere Bitfusion, mientras que las GPU que proporcionan la aceleración se instalan en los equipos del servidor de vSphere Bitfusion a través de una red. Las aplicaciones pueden abrir archivos, asignar memoria y llamar a CUDA como si funcionaran en un equipo con GPU locales.
En la siguiente figura se muestra un ejemplo de un clúster pequeño de vSphere Bitfusion, como un conjunto de equipos servidor-cliente de vSphere Bitfusion y vCenter Server en una red conmutada. Una configuración mínima de un clúster de vSphere Bitfusion es un cliente, un servidor y una instancia de vCenter Server. Es posible crear clústeres de gran tamaño con varios servidores y clientes.
Cómo funciona vSphere Bitfusion
Cuando se inicia una aplicación de AI o ML en el cliente de vSphere Bitfusion, vSphere Bitfusion intercepta las llamadas a CUDA de la aplicación y ve los datos y los punteros de datos de las llamadas. El servidor de vSphere Bitfusion no requiere una conexión con el almacenamiento, donde se guardan los datos de la aplicación, sino solo con el cliente de vSphere Bitfusion. El cliente transfiere los datos y el resto de las llamadas de CUDA al servidor. El servidor de vSphere Bitfusion procesa las llamadas y devuelve los resultados al cliente.
Al iniciar aplicaciones de AI y ML en vSphere Bitfusion, puede compartir los recursos de las GPU.
- Puede asignar los recursos de GPU de forma dinámica y acceder a ellos desde los servidores de vSphere Bitfusion.
Las aplicaciones pueden compartir recursos de GPU que no están instalados en máquinas locales y puede ejecutar cada aplicación en un entorno adecuado en un cliente de vSphere Bitfusion configurado, como una máquina virtual, una máquina sin sistema operativo o un contenedor. Las aplicaciones consumen servicios de aceleración de GPU de un grupo de servidores de vSphere Bitfusion a través de una red y consumen los recursos solo durante el período de tiempo en el que se ejecuta una aplicación o sesión. Las GPU vuelven al grupo cuando se completan las aplicaciones o sesiones.
- Puede acceder a particiones de los recursos de GPU para permitir el uso compartido simultáneo con otras aplicaciones.
La memoria de una GPU física puede dividirse en fracciones de tamaño arbitrario. Cada fracción se puede asignar a una aplicación diferente al mismo tiempo. El uso compartido de vSphere Bitfusion es posible gracias a una tecnología de interposición. vSphere Bitfusion intercepta las llamadas de la API que normalmente abordan un acelerador local en un bus de host PCIe y envían las llamadas de la API y los datos relacionados a través de una red. vSphere Bitfusion proporciona servicios de uso compartido para aplicaciones de AI y ML y admite la API de CUDA para las GPU NVIDIA de destino.
¿Cuáles son los componentes principales de vSphere Bitfusion?
- ¿Qué es un servidor de vSphere Bitfusion?
- El servidor de vSphere Bitfusion se ejecuta en un host ESXi con las GPU instaladas en local como un dispositivo de VMware, que es una máquina virtual preconfigurada que incluye software y servicios empaquetados previamente. El servidor requiere acceso a las GPU locales, generalmente a través de VMware vSphere ® DirectPath I/O™.
- ¿Qué es un cliente de vSphere Bitfusion?
- El cliente de vSphere Bitfusion se ejecuta en las máquinas virtuales que ejecutan las aplicaciones de AI y ML.
- ¿Qué es un complemento de vSphere Bitfusion?
- Los servidores de vSphere Bitfusion registran un complemento de vSphere Bitfusion con VMware vCenter Server. El complemento proporciona supervisión y administración de clientes y servidores de vSphere Bitfusion.
- ¿Qué es un clúster de vSphere Bitfusion?
- El clúster de vSphere Bitfusion es el conjunto de todos los servidores y clientes de vSphere Bitfusion en una instancia de vCenter Server.
- ¿Qué es un grupo de usuarios de Linux de vSphere Bitfusion?
-
Durante el proceso de instalación de un cliente de
vSphere Bitfusion, el cliente crea un grupo de usuarios de Linux de
vSphere Bitfusion,
bitfusion
. Solo los miembros del grupo pueden utilizar vSphere Bitfusion. Algunos archivos de configuración se configuran con los permisos adecuados y los miembros del grupo heredan los límites correspondientes para trabajar de forma efectiva con vSphere Bitfusion. - ¿Qué es un vSphere Client?
- vSphere Client permite conectarse a instancias de vCenter Server mediante un explorador web y, de esta forma, podrá administrar su infraestructura vSphere. Puede acceder al complemento de vSphere Bitfusion a través de vSphere Client.
- ¿Qué es una interfaz de línea de comandos (CLI)?
- Los servidores y los clientes de vSphere Bitfusion se pueden administrar mediante los comandos de la interfaz de línea de comandos (Command-Line Interface, CLI).
- ¿Qué es un vCenter Server?
- vCenter Server es el software de administración de servidores que proporciona una plataforma centralizada para controlar el entorno de vSphere.
Preguntas frecuentes de vSphere Bitfusion
Para obtener más información sobre vSphere Bitfusion, consulte la sección Preguntas frecuentes en la zona técnica de Cloud Platform.