Es kommt zu keinem Failover für den Speicherpfad, wenn der TUR-Befehl wiederholt Wiederholungsanforderungen zurückgibt.

Problem

Wenn bei einem Speicherpfad Probleme auftreten, sendet ein ESXi-Host normalerweise den TUR-Befehl (Test Unit Ready), um zu bestätigen, dass der Pfad vor dem Initiieren eines Pfad-Failovers deaktiviert ist. Wenn jedoch der TUR-Befehl nicht erfolgreich ist und wiederholt eine Anforderung für Wiederholungsvorgänge wiedergibt (VMK_STORAGE_RETRY_OPERATION), wiederholt der Host weiterhin den Befehl, ohne dass der Failover ausgelöst wird. In der Regel wird durch die folgenden Fehler verursacht, dass der Host den TUR-Befehl wiederholt:
  • SCSI_HOST_BUS_BUSY 0x02
  • SCSI_HOST_SOFT_ERROR 0x0b
  • SCSI_HOST_RETRY 0x0c

Ursache

Um dieses Problem zu beheben, können Sie den enable|disable_action_OnRetryErrors-Parameter verwenden. Wenn Sie diesen Parameter aktivieren, kann der ESXi-Host den problematischen Pfad als ausgefallen markieren. Wenn der Pfad als ausgefallen markiert wurde, kann der Host den Failover auslösen und einen alternativen funktionierenden Pfad verwenden.

Lösung

  1. Legen Sie den Parameter durch Ausführen eines entsprechenden Befehls durch:
    Aktion Befehl
    Aktiviert die Funktion, einen problematischen Pfad als ausgefallen zu markieren # esxcli storage nmp satp generic deviceconfig set -c enable_action_OnRetryErrors -d naa.XXX
    Deaktiviert die Funktion, einen problematischen Pfad als ausgefallen zu markieren # esxcli storage nmp satp generic deviceconfig set -c disable_action_OnRetryErrors -d naa.XXX
  2. Überprüfen Sie den Status des Parameters, indem Sie den folgenden Befehl ausführen:
    # esxcli storage nmp device list
    Mit der folgenden Beispielausgabe wird angezeigt, dass der Parameter aktiviert wurde:
    naa.XXX
    Device Display Name: DGC Fibre Channel Disk (naa.XXX)
    Storage Array Type: VMW_SATP_CX Storage Array Type Device
    Config: {navireg ipfilter action_OnRetryErrors}

    Der enable|disable_action_OnRetryErrors-Parameter ist über Neustarts hinweg persistent.

Lösung

Sie können diesen Parameter auch beim Konfigurieren einer SATP-Beanspruchungsregel festlegen:

# esxcli storage nmp satp rule add -t device -d naa.XXX -s VMW_SATP_EXAMPLE -P VMW_PSP_FIXED -o enable_action_OnRetryErrors