En tant que scientifique des données, vous pouvez déployer une station de travail RAG avec GPU activé avec une base de données PostgreSQL pgvector gérée par VMware Data Services Manager (DSM) à partir du catalogue d'Automation Service Broker en libre-service.

Lorsque vous demandez la Station de travail RAG d'IA avec DSM dans le catalogue, vous pouvez utiliser une instance de base de données existante ou en créer une. Pendant le déploiement, la VM à apprentissage profond et la VM de base de données à laquelle elle se connecte sont provisionnées. La base de données est provisionnée en dehors du déploiement RAG.

  • Si vous sélectionnez l'option Base de données existante, utilisez une base de données prédéployée, qui peut être une base de données externe ou une base de données provisionnée par un autre déploiement Station de travail RAG d'IA avec DSM. Pendant le déploiement, aucune nouvelle instance de base de données n'est provisionnée.
  • En l'absence de base de données existante que vous pouvez utiliser, ou si vous souhaitez posséder votre propre base de données privée pour un cas d'utilisation spécifique, sélectionnez la nouvelle option de base de données.

Procédure

  1. Sur la page Catalogue de Automation Service Broker, recherchez la carte Station de travail RAG d'IA avec DSM et cliquez sur Demander.
  2. Sélectionnez un projet.
  3. Entrez un nom et une description pour le déploiement.
  4. Configurez les paramètres de la station de travail RAG.
    Paramètre Exemple de valeur
    Classe de VM vgpu-1xa100-40c
    Spécifications minimales de classe de VM :
    • CPU : 10 vCPU
    • RAM de CPU : 64 Go
    • GPU : 2xH100
    • Mémoire du GPU : 50 Go
    Taille du disque de données 32 Gi

    Sélectionnez une taille de disque comprise entre 20 Go et 1 To.

    Mot de passe utilisateur Entrez un mot de passe pour l'utilisateur par défaut. Vous pouvez être invité à réinitialiser votre mot de passe lorsque vous vous connectez pour la première fois.
    Clé publique SSH Ce paramètre est facultatif.
  5. Configurez la base de données de la station de travail.
    Paramètre Exemple de valeur
    Instance de base de données Base de données existante
    Chaîne de connexion

    Fournissez la chaîne de connexion DSM à partir de la présentation du déploiement DSM.

  6. Installez les personnalisations logicielles.
    1. (Facultatif) Si vous souhaitez installer un script cloud-init personnalisé en plus du script cloud-init défini pour le bundle de logiciels RAG, cochez la case et collez le contenu du module de configuration.
      VMware Aria Automation combine le script cloud-init entre le bundle de logiciels RAG et le script cloud-init personnalisé.
    2. Fournissez votre clé d'accès au portail NVIDIA NGC.
    3. (Facultatif) Exposez les mesures de NVIDIA Data Center GPU Manager (DCGM) via un équilibrage de charge.
      NVIDIA DCGM gère et surveille les GPU dans les environnements du centre de données.
    4. Entrez les informations d'identification de Docker Hub.
  7. Cliquez sur Envoyer.