Un chemin de stockage ne bascule pas lorsque la commande TUR renvoie systématiquement des requêtes de nouvelles tentatives.

Problème

Généralement, en cas de problème avec un chemin de stockage, un hôte ESXi envoie une commande TUR (Test Unit Ready) pour confirmer que le chemin est inaccessible avant de lancer le basculement du chemin. Toutefois, si la commande TUR échoue et renvoie de manière répétée une requête de nouvelle tentative de l'opération (VMK_STORAGE_RETRY_OPERATION), l'hôte réessaye d'exécuter la commande sans déclencher de basculement. Voici les erreurs qui poussent habituellement l'hôte à réessayer d'exécuter la commande TUR :
  • SCSI_HOST_BUS_BUSY 0x02
  • SCSI_HOST_SOFT_ERROR 0x0b
  • SCSI_HOST_RETRY 0x0c

Cause

Pour résoudre ce problèmes, vous pouvez utiliser le paramètre enable|disable_action_OnRetryErrors. Lorsque vous activez ce paramètre, l'hôte ESXi peut marquer le chemin problématique comme inopérant. Une fois le chemin signalé ainsi, l'hôte peut déclencher le basculement et utiliser un chemin différent.

Solution

  1. Définissez le paramètre en exécutant la commande appropriée :
    Action Commande
    Activer la possibilité de marquer un chemin problématique comme inopérant # esxcli storage nmp satp generic deviceconfig set -c enable_action_OnRetryErrors -d naa.XXX
    Désactiver la possibilité de marquer un chemin problématique comme inopérant # esxcli storage nmp satp generic deviceconfig set -c disable_action_OnRetryErrors -d naa.XXX
  2. Vérifier l'état du paramètre en exécutant la commande suivante :
    # esxcli storage nmp device list
    L'exemple de sortie suivant indique que le paramètre est activé :
    naa.XXX
    Device Display Name: DGC Fibre Channel Disk (naa.XXX)
    Storage Array Type: VMW_SATP_CX Storage Array Type Device
    Config: {navireg ipfilter action_OnRetryErrors}

    Le paramètre enable|disable_action_OnRetryErrors est persistant malgré les redémarrages.

Solution

Vous avez aussi la possibilité de régler ce paramètre lors de la configuration d'une règle de réclamation SATP :

# esxcli storage nmp satp rule add -t device -d naa.XXX -s VMW_SATP_EXAMPLE -P VMW_PSP_FIXED -o enable_action_OnRetryErrors