En tant que scientifique des données, vous pouvez déployer un cluster Tanzu Kubernetes Grid compatible avec l'apprentissage profond qui utilise une base de données PostgreSQL pgvector gérée par VMware Data Services Manager (DSM) à partir du catalogue d'Automation Service Broker en libre-service. Vous pouvez utiliser une instance de base de données existante ou en créer une.

Lorsque vous demandez le Cluster RAG Kubernetes d'IA avec DSM dans le catalogue, vous pouvez utiliser une instance de base de données existante ou en créer une. Pendant le déploiement, la VM à apprentissage profond et la VM de base de données à laquelle elle se connecte sont provisionnées. La base de données est provisionnée en dehors du déploiement RAG.

  • Si vous sélectionnez l'option Base de données existante, utilisez une base de données prédéployée, qui peut être une base de données externe ou une base de données provisionnée par un autre déploiement Station de travail RAG d'IA avec DSM. Pendant le déploiement, aucune nouvelle instance de base de données n'est provisionnée.
  • En l'absence de base de données existante que vous pouvez utiliser, ou si vous souhaitez posséder votre propre base de données privée pour un cas d'utilisation spécifique, sélectionnez la nouvelle option de base de données.

Procédure

  1. Sur la page Catalogue de Automation Service Broker, recherchez la carte Cluster RAG Kubernetes d'IA avec DSM et cliquez sur Demander.
  2. Sélectionnez un projet.
  3. Entrez un nom et une description pour le déploiement.
  4. Sélectionnez le nombre de nœuds du panneau de contrôle.
    Paramètre Exemple de valeur
    Nombre de nœuds 1
    Classe de VM best-effort-large

    La sélection de la classe définit les ressources disponibles dans la machine virtuelle.

    Pour un nœud worker, vous pouvez utiliser 1 vGPU ou 2 vGPU par nœud worker. Pour deux nœuds worker, sélectionnez 1 vGPU par nœud.

  5. Configurez la base de données.
    Paramètre Exemple de valeur
    Instance de base de données Base de données existante
    Chaîne de connexion Fournissez la chaîne de connexion DSM à partir de la présentation du déploiement DSM.
  6. Installez les personnalisations logicielles.
    1. Fournissez votre clé API NVIDIA AI Enterprise.
    2. Sélectionnez un profil de modèle NIM.
      Ce profil définit les moteurs de modèle que NIM peut utiliser et les critères de choix de ces moteurs.
    3. Entrez les informations d'identification de Docker Hub.
  7. Cliquez sur Envoyer.