KVM ホストに展開されている NSX Manager は、get serviceget interface などの CLI コマンドが実行されると、エラーを返します。

問題

CLI コマンド get service がエラーを返します。次はその例です。

nsx-manager-1> get service
% An error occurred while processing the service command

その他の CLI コマンドもエラーを返すことがあります。get support-bundle コマンドにより、/tmp ディレクトリが読み取り専用になったことが示されます。次はその例です。

nsx-manager-1> get support-bundle file failed-to-get-service.tgz
% An error occurred while retrieving the support bundle: [Errno 30] Read-only file system: '/tmp/tmpHzXF1u'

/var/log/messages-<timestamp> ログに次のようなメッセージが表示されます。

Nov 17 07:26:48 no kernel: NMI watchdog: BUG: soft lockup - CPU#5 stuck for 23s! [qemu-kvm:4386]

原因

NSX Manager アプライアンスの 1 つ以上のファイル システムが破損しています。https://access.redhat.com/solutions/22621に、可能性のある原因がいくつか記載されています。

この問題を解決するには、破損したファイル システムを修復するか、バックアップからリストアします。

ソリューション

  1. オプション 1:破損したファイル システムを修復する次の手順は、KVM ホストで実行されている NSX Manager に固有のものです。
    1. virsh destroy コマンドを実行して NSX Manager 仮想マシンを停止します。
    2. qcow2 イメージに対し、書き込みモードで virt-rescue コマンドを実行します。次はその例です。
      virt-rescue --rw -a nsx-unified-appliance-2.0.0.0.0.6522097.phadniss-p0-DK-to-DGo-on-rhel-prod_nsx_manager_1.qcow2
    3. virt-rescue コマンド プロンプトで e2fsck コマンドを実行して tmp ファイル システムを修復します。次はその例です。
      <rescue> e2fsck /dev/nsx/tmp
    4. 必要に応じて、エラーがなくなるまで e2fsck /dev/nsx/tmp を実行します。
    5. virsh start を実行して NSX Manager を再起動します。
  2. オプション 2:バックアップからリストアする

    手順については、『NSX-T 管理ガイド』を参照してください。