컨트롤러에 대한 NSX Edge 전송 노드 연결이 종료되었습니다.

문제

원인

이 문제는 Manager에 대한 연결이 실행 중이지만 컨트롤러에 대한 연결이 종료된 경우에 발생합니다. Admin cmd 'get manager'가 활성 관리자 노드를 반환하지만 cmd 'get controllers'는 연결된 상태 및/또는 세션 상태가 [실행 중]인 이 전송 노드에 대한 활성 컨트롤러를 반환하지 않습니다.

해결책

  1. Admin CLI get maintenance-mode를 사용하여 전송 노드가 NSX 유지 보수 모드에 있지 않은지 확인하거나 API, GET api/v1/transport-nodes/<tn-uuid>| state | status를 실행합니다.
  2. API, GET /api/v1/configs/management를 실행하여 사용자 FQDN 속성(전송 노드에서 NSX Manager/컨트롤러와 통신하는 데 사용)을 확인하고 publish_FQDNS의 값을 봅니다.
  3. FQDN이 설정된 경우 먼저 컨트롤러 FQDN에 대한 ICMP ping을 실행하고 admin CLI get controllers를 실행하여 컨트롤러 FQDN 값이 올바르게 채워지는지 확인함으로써 컨트롤러 FQDN에 연결할 수 있는지와 TN에서 컨트롤러와 통신하기 위해 FQDN 값을 사용하고 있는지 확인합니다.
  4. 이전에 설명한 노드 에이전트 문제 해결 단계를 수행하여 노드 에이전트 서비스가 실행되고 있는지 확인합니다.
  5. Edge 전송 노드가 NSX 유지 보수 모드인 경우 admin CLI set maintenance-mode false 또는 API POST /api/v1/transport-nodes/<node-id>?action=exit_maintenance_mode를 실행하여 노드를 NSX 유지 보수 모드에서 해제합니다.
  6. FQDN이 설정되어 있고 ICMP ping이 컨트롤러 FQDN에 대해 작동하는 경우 publish_fqdns의 값을 false로 지정한 다음, true로 지정하고 API PUT /api/v1/configs/management를 실행하여 FQDN 속성을 설정 해제했다가 다시 설정합니다.
  7. get edge diagnosis config를 실행하여 에이전트 서비스가 NSX Edge 노드에서 실행되고 있는지 확인합니다. 서비스가 실패한 것으로 표시되면 admin CLI start service <service-name> 또는 루트 CLI etc/init.d/<service-name> start를 실행하여 다시 시작합니다.