TUR コマンドで再試行要求が繰り返される場合に、ストレージ パスがフェイルオーバーしません。

問題

通常、ストレージ パスに問題があると、ESXi ホストは、パスのフェイルオーバーを開始する前に Test Unit Ready (TUR) コマンドを送信してパスがダウンしているかを確認します。このとき、TUR コマンドが成功せず、再試行操作の要求 (VMK_STORAGE_RETRY_OPERATION) が繰り返されると、ホストはフェイルオーバーをトリガせずにコマンドの再試行を続けます。通常、次のエラーによって、ホストで TUR コマンドが再試行されます。
  • SCSI_HOST_BUS_BUSY 0x02
  • SCSI_HOST_SOFT_ERROR 0x0b
  • SCSI_HOST_RETRY 0x0c

原因

この問題の解決に、enable|disable_action_OnRetryErrors パラメータを使用できます。このパラメータを有効にすると、ESXi ホストは問題のあるパスを非活動としてマークできます。パスを非活動としてマークすると、ホストはフェイルオーバーをトリガし、代わりの機能するパスを使用できるようになります。

解決方法

  1. コマンドを実行してパラメータを設定します。
    アクション コマンド
    問題のあるパスを非活動としてマークする機能を有効にする # esxcli storage nmp satp generic deviceconfig set -c enable_action_OnRetryErrors -d naa.XXX
    問題のあるパスを非活動としてマークする機能を無効にする # esxcli storage nmp satp generic deviceconfig set -c disable_action_OnRetryErrors -d naa.XXX
  2. 次のコマンドを実行して、パラメータのステータスを確認します。
    # esxcli storage nmp device list
    次の出力例は、パラメータが有効になったことを示します。
    naa.XXX
    Device Display Name: DGC Fibre Channel Disk (naa.XXX)
    Storage Array Type: VMW_SATP_CX Storage Array Type Device
    Config: {navireg ipfilter action_OnRetryErrors}

    enable|disable_action_OnRetryErrors パラメータは再起動しても保持されます。

解決方法

このパラメータは、SATP 要求ルールを設定する際にも設定できます。

# esxcli storage nmp satp rule add -t device -d naa.XXX -s VMW_SATP_EXAMPLE -P VMW_PSP_FIXED -o enable_action_OnRetryErrors