컨트롤러에 대한 NSX Edge 전송 노드 연결이 종료되었습니다.
문제
원인
이 문제는 Manager에 대한 연결이 실행 중이지만 컨트롤러에 대한 연결이 종료된 경우에 발생합니다. Admin cmd 'get manager'가 활성 관리자 노드를 반환하지만 cmd 'get controllers'는 연결된 상태 및/또는 세션 상태가 [실행 중]인 이 전송 노드에 대한 활성 컨트롤러를 반환하지 않습니다.
해결책
- Admin CLI get maintenance-mode를 사용하여 전송 노드가 NSX 유지 보수 모드에 있지 않은지 확인하거나 API, GET api/v1/transport-nodes/<tn-uuid>| state | status를 실행합니다.
- API, GET /api/v1/configs/management를 실행하여 사용자 FQDN 속성(전송 노드에서 NSX Manager/컨트롤러와 통신하는 데 사용)을 확인하고 publish_FQDNS의 값을 봅니다.
- FQDN이 설정된 경우 먼저 컨트롤러 FQDN에 대한 ICMP ping을 실행하고 admin CLI get controllers를 실행하여 컨트롤러 FQDN 값이 올바르게 채워지는지 확인함으로써 컨트롤러 FQDN에 연결할 수 있는지와 TN에서 컨트롤러와 통신하기 위해 FQDN 값을 사용하고 있는지 확인합니다.
- 이전에 설명한 노드 에이전트 문제 해결 단계를 수행하여 노드 에이전트 서비스가 실행되고 있는지 확인합니다.
- Edge 전송 노드가 NSX 유지 보수 모드인 경우 admin CLI set maintenance-mode false 또는 API POST /api/v1/transport-nodes/<node-id>?action=exit_maintenance_mode를 실행하여 노드를 NSX 유지 보수 모드에서 해제합니다.
- FQDN이 설정되어 있고 ICMP ping이 컨트롤러 FQDN에 대해 작동하는 경우 publish_fqdns의 값을 false로 지정한 다음, true로 지정하고 API PUT /api/v1/configs/management를 실행하여 FQDN 속성을 설정 해제했다가 다시 설정합니다.
- get edge diagnosis config를 실행하여 에이전트 서비스가 NSX Edge 노드에서 실행되고 있는지 확인합니다. 서비스가 실패한 것으로 표시되면 admin CLI start service <service-name> 또는 루트 CLI etc/init.d/<service-name> start를 실행하여 다시 시작합니다.