Dans un environnement à grande échelle avec de nombreux nœuds de transport et machines virtuelles sur des hôtes ESXi, les agents NSX qui s'exécutent sur des hôtes ESXi peuvent expirer lors de la communication avec NSX Manager.

Problème

Certaines opérations échouent, comme lorsqu'une VNIC de machine virtuelle essaie de s'attacher à un commutateur logique. Le fichier /var/run/log/nsx-opsagent.log contient des messages tels que :
level="ERROR" errorCode="MPA41542"] [MP_AddVnicAttachment] RPC call [0e316296-13-14] to NSX management plane timout
2017-05-15T05:32:13Z nsxa: [nsx@6876 comp="nsx-esx" subcomp="NSXA[VifHandlerThread:-2282640]" tid="1000017079" level="ERROR" errorCode="MPA42003"] [DoMpVifAttachRpc] MP_AddVnicAttachment() failed: RPC call to NSX management plane timout

Cause

Dans un environnement à grande échelle, certaines opérations peuvent être plus longues que d'habitude et finissent par échouer, car les valeurs de délai d'expiration par défaut sont dépassées.

Solution

  1. Augmentez la valeur du délai d'expiration de l'agent NSX.
    1. Sur l'hôte ESXi, arrêtez l'opsAgent NSX avec la commande suivante :
      /etc/init.d/nsx-opsagent stop
    2. Modifiez le fichier /etc/vmware/nsx-opsagent/nsxa.json et modifiez la valeur de vifOperationTimeout de 25 à 55, par exemple.
      "mp" : {
          /* timeout for VIF operation */
          "vifOperationTimeout" : 25,
      Note : Cette valeur du délai d'expiration doit être inférieure à la valeur de délai d'expiration de hostd que vous avez défini à l'étape 2.
    3. Démarrez l'opsAgent NSX avec la commande suivante :
      /etc/init.d/nsx-opsagent start
  2. Augmentez la valeur du délai d'expiration de hostd.
    1. Sur l'hôte ESXi, arrêtez l'agent hostd avec la commande suivante :
      /etc/init.d/hostd stop
    2. Modifiez le fichier /etc/vmware/hostd/config.xml. Sous <opaqueNetwork>, supprimez le commentaire de l'entrée pour <taskTimeout> et modifiez la valeur de 30 à 60, par exemple.
      <opaqueNetwork>
          <!-- maximum message size allowed in opaque network manager IPC, in bytes. -->
          <!-- <maxMsgSize> 65536 </maxMsgSize> -->
          <!-- maximum wait time for opaque network response -->
          <!-- <taskTimeout> 30 </taskTimeout> -->
    3. Démarrez l'agent hostd avec la commande suivante :
      /etc/init.d/hostd start