vSAN 경합 대시보드는 vSAN 성능을 관리하기 위한 기본 대시보드입니다. VMware 관리자 또는 설계자는 이를 사용하여 vSAN 클러스터 성능을 모니터링하고 문제를 해결할 수 있습니다. 성능 문제가 있다고 판단되는 경우 vSAN 활용률 대시보드를 사용하여 경합의 원인이 높은 활용률인지 확인합니다.

설계 시 고려 사항

모든 성능 관리 대시보드 간의 공통 설계 고려 사항을 보려면 성능 대시보드을(를) 참조하십시오.

vSAN 경합 대시보드는 vSphere 클러스터 용량을 보완하고 동일한 설계 고려 사항을 공유합니다. 이는 스토리지 및 vSAN 특정 메트릭에 중점을 둔 것이며 이미 다룬 항목은 반복하지 않습니다. vSAN 클러스터가 아닌 클러스터는 나열되지 않습니다.

대시보드 사용 방법

  • vSAN 피크 VM 지연 시간, vSAN 피크 CPU 준비, vSAN 피크 손실 패킷
    • 3개의 분포 차트를 검토하여 모든 vSAN 클러스터 성능에 대한 개요를 확인합니다.
    • vSAN 피크 VM 지연 시간 차트는 클러스터의 모든 VM에 의해 발생한 디스크 지연 시간 분포를 보여 줍니다. 대부분의 VM이 예상과 일치하는 지연 시간이 발생하는 것으로 예상해야 합니다. 예를 들어 모든 플래시 시스템에서 VM의 디스크 지연 시간은 20밀리초 이상이 되어서는 안 됩니다. vSAN 환경이 전체 플래시인 경우에는 분포 버켓을 보다 엄격한 집합으로 조정해야 합니다.
    • vSAN 피크 CPU 준비 차트는 vSAN 커널 모듈이 CPU를 기다려야 하는지 여부를 표시합니다. vSAN이 CPU 시간을 기다리지 않아야 하므로 이 숫자는 0%에 근접하고 1% 미만으로 예상합니다. vSAN은 커널 공간에 상주하므로 VM World보다 우선 순위가 더 높습니다.
    • vSAN 피크 손실된 패킷 차트는 vSAN 클러스터가 vSAN 네트워크(VM 네트워크 아님)에서 패킷을 손실하고 있는지 여부를 표시합니다. vSAN은 네트워크에 의존하여 클러스터를 동기화 상태로 유지합니다. 이 숫자는 0%에 근접하고 1% 미만이어야 합니다.
  • vSAN 클러스터
    • 가장 적게 작동을 기준으로 정렬된 모든 vSAN 클러스터를 나열합니다.
    • 지난 24시간 동안 최악의 성능으로 정렬된 모든 ESXi 호스트를 나열합니다. 테이블이 모두 녹색을 표시하면 추가로 분석할 필요가 없습니다. 24시간이 1주일 대신 선택된 이유는 24시간보다 큰 성능 문제가 관련이 없을 가능성이 크기 때문입니다.
    • 기간을 원하는 기간으로 변경할 수 있습니다. 이에 따라 최대 수가 반영됩니다.
  • vSAN 클러스터 테이블에서 vSAN 클러스터를 선택합니다.
    • 모든 상태 차트에는 선택한 클러스터의 KPI가 표시됩니다.
    • SMART를 사용하는 경우, 대시보드 하단의 두 개의 히트 맵에 조기 주의가 제공됩니다.

참고 사항

  • 대형 vSAN 클러스터에는 많은 구성 요소가 있을 수 있습니다. 이러한 각 구성 요소에는 여러 성능 메트릭이 있을 수 있습니다. 총 KPI 수가 수백 개의 메트릭에 달할 수 있습니다. 예로 10개의 노드 클러스터를 들어보겠습니다. 이를 확인하는 데는 530개의 카운터가 있을 수 있습니다. vRealize Operations는 KPI 집합을 도입하여 이 카운터를 집계합니다. 이 분석을 통해 숫자를 보다 관리가 용이한 숫자로 줄일 수 있습니다. 다음 테이블에는 KPI와 해당 수식이 나와 있습니다.
    이름 설명
    최대 용량 디스크 지연 시간(ms) 단일 용량 디스크의 지연 시간이 이미 모든 VM의 평균이기 때문에 모든 용량 디스크의 최대 지연 시간은 평균이 아닌 최악을 선택합니다. 디스크에 50개의 VM이 있고 30개가 발행 중인 IO의 경우 평균 30이 됩니다.
    최소 사용 가능한 디스크 그룹 쓰기 버퍼(%) 모든 디스크 그룹 쓰기 버퍼에서 가장 적은 사용 가능 용량입니다. 이 숫자가 적으면 버퍼 중 하나가 충분하지 않은 것입니다. 캐시를 최대화하려고 할 때 적은 숫자는 용량 관리에 대한 조기 주의입니다.
    최대 디스크 그룹 읽기 캐시/쓰기 버퍼 지연 시간(ms) 각 디스크에는 읽기 캐시 읽기 지연 시간, 읽기 캐시 쓰기 지연 시간(캐시로 쓰기용), 쓰기 버퍼 쓰기 지연 시간, 쓰기 버퍼 읽기 지연 시간(준비 취소 목적)이 있습니다. 이는 4개의 숫자 중 가장 높은 숫자를 가지므로 모든 디스크 그룹에서 가장 높습니다. 4개의 각 데이터 지점이 모든 VM의 평균이므로 최대 중의 최대가 됩니다.
    디스크 그룹 오류 합계 모든 디스크 그룹 간에 취소된 명령 합계 + 버스 재설정 합계입니다. 각 구성원이 0을 반환해야 하므로 합계를 사용하고 최대값을 가져오지 않아야 합니다.
    60이 넘는 디스크 그룹 정체 수 60 이상인 디스크 그룹 정체의 수입니다. 60은 올바른 시작 지점이므로 vSAN 관리 팩에서 하드 코딩됩니다. 60이 넘는 정체는 조기 주의를 제공하므로 해당 발생 횟수를 계산합니다.
    최대 디스크 그룹 정체 모든 디스크 그룹 간의 가장 높은 정체입니다. 숫자가 높으면 하나 이상의 디스크 그룹이 작동하고 있지 않음을 나타냅니다.
    최소 사용 가능 디스크 그룹 용량(%) 모든 디스크 그룹 간에 사용 가능한 최저 용량입니다. 공간이 부족하면 재조정을 트리거합니다.
    최소 디스크 그룹 읽기 캐시 적중률(%) 디스크 그룹 읽기 캐시 중 가장 낮은 적중률입니다. 이 값이 캐시에서 읽기를 제공하고 있다는 것을 나타내므로 높은 값인지 확인합니다.
    손실된 vSAN 포트 그룹 패킷 합계(%) 모든 vSAN VMkernel 포트 RX 손실 패킷 + TX 손실 패킷의 합계입니다. vSAN 네트워크에 손실된 패킷이 없을 것으로 예상해야 합니다.