ESXi 호스트에 다수의 전송 노드와 VM이 있는 대규모 환경에서, ESXi 호스트에서 실행되는 NSX 에이전트는 NSX Manager와 통신할 때 시간이 초과될 수 있습니다.

문제

VM vnic이 논리적 스위치에 연결하려는 경우와 같은 일부 작업이 실패합니다. /var/run/log/nsx-opsagent.log에 다음과 같은 메시지가 있습니다.
level="ERROR" errorCode="MPA41542"] [MP_AddVnicAttachment] RPC call [0e316296-13-14] to NSX management plane timout
2017-05-15T05:32:13Z nsxa: [nsx@6876 comp="nsx-esx" subcomp="NSXA[VifHandlerThread:-2282640]" tid="1000017079" level="ERROR" errorCode="MPA42003"] [DoMpVifAttachRpc] MP_AddVnicAttachment() failed: RPC call to NSX management plane timout

원인

대규모 환경에서는 일부 작업이 평소보다 오래 걸리므로 기본 시간 초과 값이 초과되어 실패할 수 있습니다.

해결책

  1. NSX 에이전트 시간 초과 값(초)을 늘립니다.
    1. ESXi 호스트에서 다음 명령을 사용하여 NSX opsAgent를 중지합니다.
      /etc/init.d/nsx-opsagent stop
    2. /etc/vmware/nsx-opsagent/nsxa.json 파일을 편집하고 vifOperationTimeout 값을 25초에서 예를 들어, 55초로 변경합니다.
      "mp" : {
          /* timeout for VIF operation */
          "vifOperationTimeout" : 25,
      참고: 이 시간 초과 값은 2단계에서 설정하는 hostd 시간 초과 값보다 작아야 합니다.
    3. 다음 명령을 사용하여 NSX opsAgent를 시작합니다.
      /etc/init.d/nsx-opsagent start
  2. hostd 시간 초과 값(초)을 늘립니다.
    1. ESXi 호스트에서 다음 명령을 사용하여 hostd 에이전트를 중지합니다.
      /etc/init.d/hostd stop
    2. /etc/vmware/hostd/config.xml 파일을 편집합니다. <opaqueNetwork>아래에서 <taskTimeout>에 대한 항목의 주석 처리를 제거하고 값을 30초에서 예를 들어, 60초로 변경합니다.
      <opaqueNetwork>
          <!-- maximum message size allowed in opaque network manager IPC, in bytes. -->
          <!-- <maxMsgSize> 65536 </maxMsgSize> -->
          <!-- maximum wait time for opaque network response -->
          <!-- <taskTimeout> 30 </taskTimeout> -->
    3. 다음 명령을 사용하여 hostd 에이전트를 시작합니다.
      /etc/init.d/hostd start