클라우드 관리자가 VMware Aria Automation에서 Private AI Automation Services를 설정한 경우 Automation Service Broker 카탈로그를 사용하여 AI 워크플로에 액세스하고 요청할 수 있습니다.
데이터 과학자 또는 DevOps 엔지니어는 다음과 같은
Private AI Automation Services 카탈로그 항목을 요청할 수 있습니다.
- AI Workstation – 원하는 vCPU, vGPU, 메모리 및 PyTorch, CUDA 샘플 및 TensorFlow와 같은 AI/ML 프레임워크를 미리 설치하는 옵션으로 구성할 수 있는 GPU 지원 가상 시스템입니다.
- AI RAG Workstation – RAG(검색 증강 생성) 참조 솔루션을 갖춘 GPU 지원 가상 시스템입니다.
- Triton 추론 서버 - NVIDIA Triton 추론 서버가 있는 GPU 지원 가상 시스템입니다.
- AI Kubernetes 클러스터 – AI/ML 클라우드 네이티브 워크로드를 실행하기 위한 GPU 지원 작업자 노드가 있는 VMware Tanzu Kubernetes Grid 클러스터입니다.
- AI Kubernetes RAG 클러스터 – 참조 RAG 솔루션을 실행하기 위한 GPU 지원 작업자 노드가 있는 VMware Tanzu Kubernetes Grid 클러스터입니다.
시작하기 전에
- 클라우드 관리자가 프로젝트에 대해 Private AI Automation Services를 구성했는지 확인합니다.
- AI 카탈로그 항목을 요청할 수 있는 사용 권한이 있는지 확인합니다.
Private AI Automation Services 카탈로그 항목에 액세스하는 방법
Automation Service Broker에서 [사용] 탭을 열고 [카탈로그]를 클릭합니다. 사용 가능한 카탈로그 항목은 선택한 프로젝트를 기반으로 합니다. 프로젝트를 선택하지 않은 경우 사용할 수 있는 모든 카탈로그 항목이 카탈로그에 표시됩니다.
이 섹션에 설명된 절차에 표시된 모든 값은 사용 사례 샘플입니다. 계정 값은 환경에 따라 다릅니다.
개인 AI 배포를 모니터링하는 방법
Automation Service Broker의 [배포] 페이지를 사용하여 배포 및 연결된 리소스를 관리하고, 배포를 변경하고, 실패한 배포 문제를 해결하고, 리소스를 변경하고, 사용되지 않는 배포를 삭제할 수 있습니다.
배포를 관리하려면
를 선택합니다.자세한 내용은 내 Automation Service Broker 배포를 관리하는 방법 항목을 참조하십시오.