サーバのフラッピング

サーバの稼動状態と停止状態が短時間に頻繁に切り替わるフラッピングは、一般的な問題です。一般的に、サーバフラッピングは、サーバが健全性モニターの許容される最大応答時間に到達するか、わずかに超えた場合に発生します。

[アプリケーション] > [プール] > [分析] の順に移動して、サーバがフラッピングしているかどうかを検証し、プール内の特定のサーバの分析ページに移動します。メイングラフの [アラート] および [システムイベント] オーバーレイアイコンを有効にします。選択した期間のサーバの稼動/停止イベントが表示されます。このページには、失敗している健全性モニターも表示されます。

サーバからの応答時間を、健全性モニターの構成済みの受信タイムアウトウィンドウと比較します。これらのタイマーが原因で障害が発生した可能性がある場合は、いくつかの手順を実行して問題を解決できます。

サーバを追加する: これは、バックエンドデータベースが原因で速度低下が発生した場合には役立たない可能性がありますが、過負荷状態またはビジー状態のサーバに対しては迅速かつ永続的な修正になる場合があります。
健全性モニターの受信タイムアウトウィンドウを増やす: タイムアウト値は 1 から 300 秒にできます。タイムアウト値は、常に健全性モニターの送信間隔よりも短くする必要があります。
必要な成功したチェック数を増やし、許可される失敗したチェック数を減らす: これにより、サーバがすぐにはローテーションに復帰しなくなり、応答が遅れる原因となっているプロセスの処理に、潜在的により多くの時間をかけられるようになる可能性があります。
接続ランプアップを変更する（最小接続数のロードバランシングアルゴリズムを使用している場合）: サーバは、最初に起動したときに、多くの接続を早く受信しすぎる可能性があります。たとえば、1 台のサーバに 1 つの接続があり、残りのサーバに 100 個の接続がある場合、最小接続アルゴリズは、新しいサーバが次の 99 個の接続を受信する必要があると指定します。これにより、サーバが簡単に過負荷状態になり、接続のフラッシュクラウドを残りのサーバで処理する必要があるため、ドミノ効果が発生します。接続ランプアップの機能は、プールの構成の [詳細] タブで構成できます。接続ランプアップ機能により、新しいサーバに送信される新しい接続の割合が徐々に増加します。サーバのカスケード障害が発生している場合は、ランプアップ時間を増やすと解決できる場合があります。
サーバ 1 台あたりの最大接続数を設定する: このオプションは、プール構成の [詳細] タブで構成できます。これにより、サーバが過負荷状態にならず、最適な速度で接続を処理できるようになります。