사용자 인터페이스에 Meterics-PostDeployment failed 오류 메시지가 표시됩니다.

문제

NSX 메트픽 기능을 배포한 후 배포 후 API 호출을 수행하는 동안 시스템에서 오류가 발생했습니다.

원인

NSX 메트픽 기능을 배포한 후 시스템은 NSX Application Platform에서 NSX 및 ClusterApi 포드에 대한 API 호출을 수행하는 배포 후 API 요청을 전송합니다. 시스템에서 오류가 발생함

해결책

  1. 시스템이 NSX Application Platform을 성공적으로 배포했는지 확인합니다.
  2. NSX Manager CLI(명령줄 인터페이스)에 액세스할 수 있는 경우 다음 단계를 사용하여 NSX 메트픽 로그에 기록된 오류를 조사합니다. NSX Manager CLI에 액세스할 수 없는 경우 3단계에 제공된 정보를 사용합니다.
    1. 루트 사용자 권한으로 NSX Manager 장치에 로그인합니다.
    2. 후속 helmkubectl 명령 호출에 대한 Kubernetes 구성을 표시합니다.
      export KUBECONFIG=/config/vmware/napps/.kube/config
    3. 다음 명령을 사용하여 시스템이 메트릭 helm 차트를 성공적으로 배포했는지 확인합니다.
      helm --namespace nsxi-platform list --all --filter 'metrics'

      STATUS 속성은 배포됨을 표시해야 합니다.

    4. 다음 명령을 사용하여 설정 포드가 배포되고 성공적으로 완료되었는지 확인합니다.
      kubectl --namespace nsxi-platform get pods --selector='app.kubernetes.io/instance=metrics'
    5. 다음 명령을 사용하여 metrics-app-server 포드의 로그를 검사합니다. POD_NAME은 예외 또는 오류에 대한 metrics-app-server-*로 시작됩니다.
      kubectl --namespace nsxi-platform logs  "<POD_NAME>" 
  3. NSX Manager CLI에 액세스할 수 없는 경우 UI를 사용하여 NSX Application Platform에 대한 지원 번들 수집의 정보를 사용하여 NSX Application Platform 지원 번들을 수집합니다. 이름이 metrics-app-server로 시작하는 감독자의 TKG 클러스터 또는 업스트림 Kubernetes 포드에 대한 지원 번들 로그를 검사합니다.
  4. 배포 후 호출 napp/api/v1/metrics/data-collection API GETPOST를 사용하여 데이터 수집의 소스를 읽고 설정할 수 있습니다. 데이터 수집을 켜짐 또는 꺼짐으로 토글할 수 있습니다. 문제가 발생했으며 배포 후 API가 성공적으로 완료된 경우 일부 호스트에 대한 데이터 수집 특성이 켜져 있지 않은지 수동으로 확인한 다음, 원하는 대로 켤 수 있습니다.
  5. 또한 /infra/sites/intelligence/registration GET/infra/sites/intelligence/registration/{cluster-id} POST API는 배포 후 단계의 일부로 호출됩니다. api/v1/infra/sites/intelligence/registration 출력에는 is_metrics_enabled 특성이 있습니다. 이 특성은 배포 중에 설정해야 하며 배포 후 작업이 성공적으로 완료되었음을 나타냅니다. 설정되지 않은 경우 다음 정보를 사용하여 NSX 메트픽 기능을 수동으로 설정할 수 있습니다.
    1. 다음과 유사하게 JSON 컨텐츠를 반환하는 GET napp/api/v1/metrics/data-collection 명령을 호출합니다.
      {
          "metrics_toggle_nsx": true,
          "metrics_toggle_nsx_cloud_native": true,
          "metrics_toggle_nsx_config": false
      }
    2. false로 설정된 모든 플래그를 찾아서 true로 전환합니다. 좀 더 구체적으로 말하면 metrics_toggle_nsx_configmetrics_toggle_nsx 특성이 true로 설정되어 있는지 확인합니다.
      {
          "metrics_toggle_nsx": true,
          "metrics_toggle_nsx_cloud_native": true,
          "metrics_toggle_nsx_config": true
    3. 플래그가 true로 설정된 수정된 본문을 사용하여 POST napp/api/v1/metrics/data-collection 명령을 호출합니다.