Un carico di lavoro RAG (Retrieval-Augmented Generation) è costituito da un LLM e da una knowledge base esterna con i dati più recenti, archiviati in un database vettore. In VMware Private AI Foundation with NVIDIA è possibile configurare un carico di lavoro RAG per utilizzare le integrazioni di un database vettore gestito da VMware Data Services Manager.
Nota: Questa documentazione si basa su
VMware Cloud Foundation 5.2.1. Per informazioni sulla funzionalità
VMware Private AI Foundation with NVIDIA in
VMware Cloud Foundation 5.2, vedere
Guida di VMware Private AI Foundation with NVIDIA per VMware Cloud Foundation 5.2.