TUR コマンドで再試行要求が繰り返される場合に、ストレージ パスがフェイルオーバーしません。
問題
通常、ストレージ パスに問題があると、ESXi ホストは、パスのフェイルオーバーを開始する前に Test Unit Ready (TUR) コマンドを送信してパスがダウンしているかを確認します。このとき、TUR コマンドが成功せず、再試行操作の要求 (VMK_STORAGE_RETRY_OPERATION) が繰り返されると、ホストはフェイルオーバーをトリガせずにコマンドの再試行を続けます。通常、次のエラーによって、ホストで TUR コマンドが再試行されます。
- SCSI_HOST_BUS_BUSY 0x02
- SCSI_HOST_SOFT_ERROR 0x0b
- SCSI_HOST_RETRY 0x0c
原因
この問題の解決に、enable|disable_action_OnRetryErrors パラメータを使用できます。このパラメータを有効にすると、ESXi ホストは問題のあるパスを非活動としてマークできます。パスを非活動としてマークすると、ホストはフェイルオーバーをトリガし、代わりの機能するパスを使用できるようになります。
解決方法
- コマンドを実行してパラメータを設定します。
アクション |
コマンド |
問題のあるパスを非活動としてマークする機能を有効にする |
# esxcli storage nmp satp generic deviceconfig set -c enable_action_OnRetryErrors -d naa.XXX |
問題のあるパスを非活動としてマークする機能を無効にする |
# esxcli storage nmp satp generic deviceconfig set -c disable_action_OnRetryErrors -d naa.XXX |
- 次のコマンドを実行して、パラメータのステータスを確認します。
# esxcli storage nmp device list
次の出力例は、パラメータが有効になったことを示します。
naa.XXX
Device Display Name: DGC Fibre Channel Disk (naa.XXX)
Storage Array Type: VMW_SATP_CX Storage Array Type Device
Config: {navireg ipfilter action_OnRetryErrors}
enable|disable_action_OnRetryErrors パラメータは再起動しても保持されます。
解決方法
このパラメータは、SATP 要求ルールを設定する際にも設定できます。
# esxcli storage nmp satp rule add -t device -d naa.XXX -s VMW_SATP_EXAMPLE -P VMW_PSP_FIXED -o enable_action_OnRetryErrors