TUR 명령이 반복적으로 재시도 요청을 반환하면 스토리지 경로가 페일오버되지 않습니다.

문제

일반적으로 스토리지 경로에 문제가 발생하는 경우 ESXi 호스트는 경로 페일오버를 시작하기 전에 TUR(Test Unit Ready) 명령을 전송하여 경로가 다운되었음을 확인합니다. 하지만 TUR 명령이 실패하고 반복적으로 재시도 작업 요청(VMK_STORAGE_RETRY_OPERATION)을 반환하는 경우 호스트는 페일오버를 트리거하지 않고 계속해서 명령을 재시도합니다. 보통 다음과 같은 오류로 인해 호스트가 TUR 명령을 재시도합니다.
  • SCSI_HOST_BUS_BUSY 0x02
  • SCSI_HOST_SOFT_ERROR 0x0b
  • SCSI_HOST_RETRY 0x0c

원인

이 문제를 해결하기 위해 enable|disable_action_OnRetryErrors 매개 변수를 사용할 수 있습니다. 이 매개 변수를 사용하도록 설정하면 ESXi 호스트가 문제의 경로를 비활성으로 표시할 수 있습니다. 경로가 비활성으로 표시되면 호스트가 페일오버를 트리거하고 대체 작업 경로를 사용할 수 있습니다.

해결책

  1. 적절한 명령을 실행하여 매개 변수를 설정합니다.
    작업 명령
    문제의 경로를 비활성으로 표시하는 설정 사용 # esxcli storage nmp satp generic deviceconfig set -c enable_action_OnRetryErrors -d naa.XXX
    문제의 경로를 비활성으로 표시하는 설정 사용 안 함 # esxcli storage nmp satp generic deviceconfig set -c disable_action_OnRetryErrors -d naa.XXX
  2. 다음 명령을 실행하여 매개 변수의 상태를 확인합니다.
    # esxcli storage nmp device list
    다음 출력 예는 매개 변수가 사용되도록 설정되었음을 나타냅니다.
    naa.XXX
    Device Display Name: DGC Fibre Channel Disk (naa.XXX)
    Storage Array Type: VMW_SATP_CX Storage Array Type Device
    Config: {navireg ipfilter action_OnRetryErrors}

    enable|disable_action_OnRetryErrors 매개 변수는 재부팅해도 영구적으로 유지됩니다.

해결책

SATP 할당 규칙을 구성할 때 이 매개 변수를 설정할 수도 있습니다.

# esxcli storage nmp satp rule add -t device -d naa.XXX -s VMW_SATP_EXAMPLE -P VMW_PSP_FIXED -o enable_action_OnRetryErrors