RDMA over Converged Ethernet により、イーサネット ネットワーク経由の低遅延、軽量、および高スループット RDMA 通信が実現します。RoCE には、レイヤー 2 のみ、またはレイヤー 2 とレイヤー 3 の両方で、ロスレス情報トラフィック用に構成されたネットワークが必要です。

RDMA over Converged Ethernet (RoCE) は、RDMA を使用して、ネットワークに負荷のかかるアプリケーションに対して高速データ転送を提供するネットワーク プロトコルです。RoCE を使用すると、ホスト間のメモリ転送を、ホストの CPU を使用せずに直接行うことができます。

RoCE プロトコルには 2 つのバージョンがあります。RoCE v1 は、リンク ネットワーク レイヤー(レイヤー 2)で動作します。RoCE v2 は、インターネット ネットワーク レイヤー(レイヤー 3)で動作します。RoCE v1 と RoCE v2 の両方に、ロスレス ネットワーク構成が必要です。RoCE v1 にはロスレス レイヤー 2 ネットワークが必要です。また、RoCE v2 では、レイヤー 2 とレイヤー 3 の両方が、ロスレス操作に対して構成されている必要があります。

ロスレス レイヤー 2 ネットワーク

ロスレス レイヤー 2 環境を確保するには、トラフィック フローを制御できなければなりません。フロー制御は、ネットワーク全体でグローバル一時停止を有効にするか、Data Center Bridging (DCB) グループで定義された PFC (Priority Flow Control) プロトコルを使用することで実現します。PFC は、サービス クラス フィールド 802.1Q VLAN タグを使用して、トラフィックの優先順位を個別に設定するレイヤー 2 プロトコルです。このプロトコルは、個別のサービス クラスの優先順位に従って、レシーバに対するパケット転送を一時停止します。この方法で、1 つのリンクが、ロスレス RoCE トラフィックと、損失の多いベストエフォート トラフィックの両方を伝送します。トラフィック フローの輻輳が発生すると、損失が多い重要なトラフィックが影響を受ける場合があります。フローを相互に切り離すには、PFC 優先順位対応 VLAN で RoCE を使用します。

ロスレス レイヤー 3 ネットワーク

RoCE v2 では、レイヤー 3 のルーティング デバイスでロスレス データ転送を保持する必要があります。レイヤー 3 ルーターでレイヤー 2 PFC ロスレス優先順位の転送を有効にするには、パケットの受信優先順位の設定が、レイヤー 3 の対応する Differentiated Serviced Code Point (DSCP) QoS 設定にマッピングされるように、ルーターを構成します。転送された RDMA パケットは、レイヤー 3 DSCP または レイヤー 2 Priority Code Point (PCP)、あるいはその両方でマークされます。ルーターは、DSCP または PCP のいずれかを使用して、優先順位情報をパケットから抽出します。PCP を使用する場合、パケットには VLAN タグが必要です。ルーターは、このタグの PCP ビットをコピーして、次のネットワークに転送します。パケットが DSCP でマークされている場合、ルーターは、DSCP ビットをそのままにしておく必要があります。

RoCE v1 と同様、RoCE v2 も、PFC 優先順位対応 VLAN で実行する必要があります。

注: NIC で RDMA を使用する場合は、RoCE NIC をグループにまとめないでください。

ベンダー固有の構成情報については、各デバイスまたはスイッチ ベンダーの公式ドキュメントを参照してください。