문제 해결 탭을 사용하여 경고 권장 사항이나 간단한 분석으로 해결되지 않는 문제의 근본 원인을 식별합니다.

이 태스크 정보

클러스터와 호스트 시스템에 발생하는 용량 문제의 증상을 추가로 해결하고 이러한 문제가 발생한 시기를 확인하려면 문제 해결 탭을 사용하여 계속해서 메모리 문제를 조사합니다.

필수 조건

분석 탭을 사용하여 환경을 분석합니다. 환경 상태 분석을 참조하십시오.

프로시저

  1. 메뉴에서 환경을 클릭한 다음 왼쪽 창에서 vSphere 호스트 및 클러스터를 클릭하고 개체를 선택합니다. USA-Cluster를 예로 들 수 있습니다.
  2. 경고 탭을 클릭하고 증상을 검토합니다.

    증상 탭에는 선택한 클러스터에서 트리거된 증상이 표시됩니다. 여러 개의 치명적인 증상이 있습니다.

    • 커밋된 프로젝트가 포함된 클러스터 계산 리소스의 남은 시간이 심각하게 낮습니다.

    • 클러스터 계산 리소스의 남은 시간이 심각하게 낮습니다.

    • 남은 용량이 심각하게 낮습니다.

  3. 치명적인 증상을 분석합니다.
    1. 각 치명적인 증상 위에 마우스 커서를 올려 사용한 메트릭을 식별합니다.
    2. 클러스터에 영향을 주는 증상만 보려면 빠른 필터 텍스트 상자에 클러스터를 입력합니다.

      Cluster Compute Resource Time Remaining is critically low에 마우스 커서를 올리면 Badge|Time Remaining with committed projects (%) 메트릭이 나타납니다. 메트릭 값이 0 이하이고 이로 인해 USA-Cluster의 용량 증상은 경고를 트리거하고 생성합니다.

  4. 이벤트 > 타임라인 탭을 클릭하여 USA-Cluster에서 발생한 트리거된 증상, 경고 및 이벤트를 시간에 따라 검토하고 문제가 발생한 시기를 식별합니다.
    1. 일정을 클릭하고 지난 7일을 범위로 선택합니다.

      여러 개의 이벤트가 빨간색으로 나타납니다.

    2. 각 이벤트 위에 마우스 커서를 올려 세부 정보를 확인합니다.
    3. 클러스터의 데이터 센터에서 발생한 이벤트를 표시하려면 볼 위치를 클릭하고 데이터 센터를 선택합니다.

      데이터 센터의 주의 이벤트가 노란색으로 나타납니다.

    4. 마우스 커서를 주의 이벤트 위에 올립니다.

      밀도가 낮아지기 시작하고 저녁 시간에는 데이터 센터에서 하드 임계값 위반이 발생했습니다. 하드 임계값 위반에서는 Badge|Density 메트릭 값이 25의 허용 가능한 값보다 낮고 14.89 값으로 위반이 트리거되었음을 표시합니다.

    5. 영향을 받는 하위 개체를 보려면 볼 위치를 클릭하고 호스트 시스템을 선택합니다.
  5. 이벤트 탭을 클릭하여 USA-Cluster에서 발생한 변경 사항을 검토하고, 경고의 근본 원인 또는 클러스터의 다른 문제에 기여한 변경 사항이 발생했는지 확인합니다.
    1. 그래프를 검토합니다.

      그래프를 검토하여 다시 발생한 이벤트로 인해 오류가 발생했는지 확인할 수 있습니다. 각 이벤트는 게스트 파일 시스템에 디스크 공간이 부족함을 나타냅니다. 영향을 받은 개체는 그래프 아래의 창에 나타납니다.

    2. 각 빨간색 삼각형을 클릭하여 영향을 받은 개체를 식별하고 아래 창에 강조 표시합니다.
  6. 모든 메트릭 탭을 클릭하여 환경 토폴로지의 해당 컨텍스트에서 개체를 평가함으로써 문제의 가능한 원인을 식별할 수 있습니다.
    1. 위쪽 보기에서 USA-Cluster를 선택합니다.
    2. 메트릭 창에서 배지를 확장하고 Badge|Capacity Remaining (%)을 두 번 클릭합니다.

      Badge|Capacity Remaining (%) 계산이 오른쪽 아래 창에 추가됩니다.

    3. 메트릭 창에서 밀도를 두 번 클릭합니다.
    4. 메트릭 창에서 워크로드를 두 번 클릭합니다.
    5. 도구 모음에서 날짜 컨트롤을 클릭하고 지난 7일을 선택합니다.

      메트릭 차트는 클러스터의 용량이 지난 주 동안 일정한 수준으로 유지되었지만 클러스터 밀도는 지난 며칠 동안 최대값까지 증가했음을 나타냅니다. Badge|Workload (%) 계산에서는 밀도 문제에 해당하는 워크로드 초과가 표시됩니다.

결과

클러스터의 문제와 관련된 증상, 타임라인, 이벤트 및 메트릭을 분석하고 지난 며칠 동안 클러스터의 과도한 워크로드로 인해 클러스터 밀도가 감소했음을 확인했으며, 이는 클러스터의 용량이 소진되기 시작했음을 나타냅니다.

다음에 수행할 작업

세부 정보 보기 및 열 지도를 검토하여 속성, 메트릭 및 경고를 해석함으로써 개체의 리소스에서 발생하는 추세와 스파이크, 개체 전반의 리소스 분포 및 데이터 맵을 찾아 개체 전반에서 다양한 리소스 유형의 사용을 검토합니다.