Si vous prévoyez d'utiliser la génération augmentée de récupération (RAG) avec VMware Private AI Foundation with NVIDIA, configurez une base de données PostgreSQL avec pgvector à l'aide de VMware Data Services Manager.

En tant qu'utilisateur DSM, vous pouvez créer la base de données directement dans la console VMware Data Services Manager ou, en tant qu'ingénieur DevOps ou développeur, vous pouvez utiliser un catalogue en libre-service dans VMware Aria Automation.

Conditions préalables

Procédure

  1. Déployez une base de données PostgreSQL dans le domaine de charge de travail VI et obtenez la chaîne de connexion pour la base de données.
    Vous pouvez utiliser l'un des workflows suivants. Si vous êtes scientifique des données, vous pouvez déployer directement une base de données à partir de VMware Aria Automation. Sinon, demandez un déploiement de bases de données à votre administrateur DSM ou à votre utilisateur DSM.
    Workflow de déploiement. Rôle d'utilisateur requis Description
    Déployer et obtenir la chaîne de connexion d'une base de données PostgreSQL à partir de VMware Aria Automation Scientifique des données ou ingénieur DevOps Reportez-vous à la section Déployer une base de données vectorielle à l'aide d'un élément de catalogue en libre-service dans VMware Aria Automation.
    Déployez et obtenez la chaîne de connexion d'une base de données PostgreSQL à partir de la console VMware Data Services Manager. Administrateur DSM ou utilisateur DSM, ou administrateur de cloud disposant de l'un de ces rôles Reportez-vous aux sections Création de bases de données dans VMware Data Services Manager et Connexion à une base de données dans VMware Data Services Manager.
    Déployer et obtenir la chaîne de connexion d'une base de données PostgreSQL à l'aide de la commande kubectl. Administrateur DSM ou utilisateur DSM, ou ingénieur DevOps disposant de l'un de ces rôles Reportez-vous à la section Activation de la consommation en libre-service de VMware Data Services Manager.
    Le format de la chaîne de connexion de la base de données déployée est le suivant.
    postgres://pgvector_db_admin:encoded_pgvector_db_admin_password@pgvector_db_ip_address:5432/pgvector_db_name
  2. Activez l'extension pgvector sur la base de données à l'aide de l'utilitaire de ligne de commande psql.
    1. Connectez-vous à la base de données.
      psql -h pgvector_db_ip_address -p 5432 -d pgvector_db_name -U pgvector_db_admin -W
    2. Activez l'extension pgvector.
      pgvector_db_name=# CREATE EXTENSION vector;

Que faire ensuite

Intégrez la base de données dans votre charge de travail RAG. Reportez-vous aux sections Déployer une VM à apprentissage profond avec une charge de travail RAG et Déployer une charge de travail RAG sur un cluster TKG.

Déployer une base de données vectorielle à l'aide d'un élément de catalogue en libre-service dans VMware Aria Automation

En tant que scientifique des données ou ingénieur DevOps, vous pouvez utiliser un élément de catalogue en libre-service dans Automation Service Broker pour déployer une base de données PostgreSQL pgvector gérée par VMware Data Services Manager.

Une fois déployée, l'instance de base de données peut être utilisée pour d'autres déploiements, y compris par d'autres membres de votre équipe, afin que plusieurs VM à apprentissage profond puissent partager une seule base de données vectorielle.

Procédure

  1. Sur la page Catalogue dans Automation Service Broker, recherchez la carte Base de données DSM et cliquez sur Demander.
  2. Sélectionnez un projet.
  3. Entrez un nom pour votre déploiement.
  4. Entrez un nom pour votre base de données.
  5. Configurez la base de données.
    Paramètre Exemple de valeur
    Classe de VM small

    La sélection de la classe définit la quantité de ressources de vCPU et de mémoire allouées à la base de données.

    Stratégie de stockage pacific-storage-policy
    Taille de disque 256 Gi
    Pour plus d'informations sur les paramètres de base de données, reportez-vous à la section Création de bases de données.
  6. Cliquez sur Envoyer.
  7. Obtenez la chaîne de connexion de la base de données déployée.
    1. Dans Automation Service Broker, cliquez sur Déploiements > Déploiements.
    2. Sélectionnez l'entrée de déploiement pour la base de données.
    3. Dans l'onglet Topologie, sélectionnez le modèle de cloud pour le déploiement de la base de données et, dans le menu Actions du modèle, sélectionnez Obtenir la chaîne de connexion.