Déploiement de charges de travail RAG dans VMware Private AI Foundation with NVIDIA

Une charge de travail de génération augmentée de récupération (RAG) se compose d'un grand modèle de langage (LLM, Large Language Model) et d'une base de connaissances externe avec les dernières données, stockés dans une base de données vectorielle. Dans VMware Private AI Foundation with NVIDIA, vous pouvez configurer une charge de travail RAG pour utiliser des intégrations à partir d'une base de données vectorielle gérée par VMware Data Services Manager.

Note : Cette documentation est basée sur VMware Cloud Foundation 5.2.1. Pour plus d'informations sur la fonctionnalité VMware Private AI Foundation with NVIDIA dans VMware Cloud Foundation 5.2, consultez le Guide de VMware Private AI Foundation with NVIDIA pour VMware Cloud Foundation 5.2.