Une charge de travail de génération augmentée de récupération (RAG) se compose d'un grand modèle de langage (LLM, Large Language Model) et d'une base de connaissances externe avec les dernières données, stockés dans une base de données vectorielle. Dans VMware Private AI Foundation with NVIDIA, vous pouvez configurer une charge de travail RAG pour utiliser des intégrations à partir d'une base de données vectorielle gérée par VMware Data Services Manager.