높은 수준의 자동 업데이트 적용은 하드웨어 및 소프트웨어 오류를 모니터링하고 문제를 수정하거나 하드웨어를 교체하여 자동으로 문제 해결을 시도합니다. 다른 모든 시도가 실패하면 자동 업데이트 적용 프로세스에서 수동 작업을 위한 SRE를 요청합니다.

이벤트 발생 시 Autoscaler에서 순서대로 처리하는 기능은 다음과 같습니다.

  1. 모니터링 - VMC 플랫폼은 모든 SDDC 및 SDDC 전체에 위치한 모든 호스트의 시스템 상태를 지속적으로 모니터링합니다. 장애가 감지되면 자동 업데이트 적용으로 이벤트가 전송됩니다.
    • 하드웨어 및 소프트웨어 오류 모니터링
    • 장애 감지 시 자동으로 하드웨어 프로비저닝
    • 가능한 경우 자동으로 장애 해결
    • 자동 해결이 불가능한 경우 SRE가 수동으로 개입
  2. 일시적인 이벤트 대기 - 감지된 장애 중 일부는 일시적일 수 있습니다. 예를 들어 일시적인 연결 문제로 인해 모니터링 시스템이 호스트에 도달하지 못할 수 있습니다. 자동 업데이트 적용에서는 5분 동안 대기하면서 문제가 일시적인지 여부를 확인합니다. 문제가 해결되면 어떠한 작업도 수행되지 않고 자동 업데이트 적용이 반환됩니다.
  3. 호스트 추가 - 5분 후에 오류가 해결되지 않으면 호스트가 필요한지 여부를 아직 알 수 없더라도 자동 업데이트 적용이 SDDC에 호스트를 추가하기 시작합니다. 호스트를 추가하면 필요한 경우 호스트를 사용할 수 있습니다. 장애가 있는 SDDC의 호스트를 이 호스트로 교체할 때까지 이 호스트에 대한 요금은 청구되지 않습니다.
  4. 장애 유형 결정 및 작업 수행 - 호스트는 여러 가지 이유로 실패할 수 있으며 실패 이유에 따라 서로 다른 작업이 필요할 수 있습니다. 예를 들어 vCenter Server에 여전히 연결되어 있는 호스트의 vSAN 디스크 장애는 소프트 재부팅을 통해 해결할 수 있지만 PSOD 호스트에는 하드 재부팅이 필요합니다. 이에 대한 자동 업데이트 적용 논리는 복잡하고 지속적으로 발전하지만 오류를 검토하고 가장 덜 침입적인 작업을 수행할 수 있습니다. 자동 업데이트 적용은 내부 프로세스로서, 고객은 그 논리에 액세스할 수 없습니다. 문제가 발생하는 경우 VMware 지원에 연락할 수 있습니다.
  5. 호스트 상태 점검 - 다음 단계는 업데이트 적용 작업을 통해 호스트가 수정되었는지 확인하는 것입니다. 장애가 있는 호스트가 소프트 재부팅 또는 하드 재부팅 후 정상으로 확인되면 자동 업데이트 적용에서 SDDC에 대한 추가 중단을 방지합니다. 필요한 기타 작업을 수집 및 수행하고 2단계에서 미리 추가한 새 호스트를 제거합니다.
  6. 호스트 교체 - 장애가 있는 호스트를 복구할 수 없는 경우 Autoscaler는 해당 호스트를 제거하고 2단계에서 추가한 호스트로 교체합니다. 이 단계에서 Autoscaler는 장애가 있는 호스트를 제거하고 2단계에서 추가한 호스트로 교체합니다. vSphere HA 및 vSAN이 트리거되고 계산 정책 태그가 새 호스트에 연결됩니다.