フォームにご記入ください!
アイウェーブにご連絡いただきありがとうございます。
担当者よりご連絡させていただきます!
アイウェーブにご連絡いただきありがとうございます。
担当者よりご連絡させていただきます!
ニュースレターのご購読ありがとうございます!
コンピュート集約型アプリケーションの急速な進歩により、より高速で効率的かつスケーラブルなネットワークへの要求水準が高まっています。コンバージド・イーサネット(RoCE)を介したリモート・ダイレクト・メモリー・アクセス(RDMA)は、CPUを介さずにシステム間の直接データ転送を可能にする画期的な技術として登場し、待ち時間を短縮してシステム全体の性能を向上させています。FPGA設計会社であるiWaveは、AMDのERNIC IP(イーサネットRDMAネットワーク・インターフェイス・コントローラー知的財産)を統合することによって100Gイーサネット・ソリューションの実装をさらに一歩進め、RDMA機能を同社の組み込みコンピューティング・モジュール・ポートフォリオにもたらしました。
RDMAオーバーコンバージドイーサネット(RoCE)とは何ですか?
RDMAは、ホストやサーバー間でCPUを介さずに直接メモリ転送を行う技術です。これにより、CPUをアプリケーションの実行やデータ処理などのタスクに振り向けることができ、待ち時間やCPU負荷の軽減、帯域幅の拡大など、ネットワーク性能の向上がコスト効率よく実現します。RoCEはイーサネットネットワーク上でRDMAを可能にするネットワークプロトコルです。RoCEは標準的なイーサネットインフラストラクチャを利用しながらRDMAの機能を活用するため、既存のネットワーク設定を追い越すことなくパフォーマンスの向上を求める組織にとって魅力的な選択肢となります。
RoCEの種類
コンバージド・イーサネット上のRDMAには2つのバージョンがある:RoCE v1 と RoCE v2 で、使用するネットワークアダプターによって異なります。
RoCE v1: このプロトコルは、同じイーサネット・ブロードキャスト・ドメイン(VLAN)内の2つのホスト間の通信を可能にする。イーサタイプ0x8915を利用し、標準イーサネットフレームを1500バイトに、イーサネットジャンボフレームを9000バイトに制限する。
RoCE v2:RoCE v1 の単一ブロードキャスト・ドメインに対する制限を克服し、RoCE v2 では IP ヘッダーと UDP ヘッダーを含めることでパケット・カプセル化の変更を導入しています。この変更により、RoCE v2はL2(データリンク層)とL3(ネットワーク層)の両方のネットワークで機能できるようになり、複数のサブネットにまたがるレイヤ3ルーティングとスケーラビリティが可能になった。Routable RoCE(RRoCE)と呼ばれるRoCE v2は、IPマルチキャストの機能も導入している。
ERNIC IP、RDMA機能を強化
ERNIC(Embedded RDMA enabled NIC)IPは、AMD FPGA、MPSoC、ソフトMAC IP実装とシームレスに動作するように設計された、カスタマイズ可能なイーサネットRDMAネットワーク・インターフェイス・コントローラIPコアです。このIPは、標準イーサネット上で高スループット、低レイテンシ、完全にハードウェア・オフロードされた信頼性の高いデータ転送ソリューションを提供します。
iWaveは最先端技術の最前線にあり、100Gイーサネット・ソリューションの実装に成功し、そのプラットフォームの驚くべき能力を示しました。これは、iWaveのZynq UltraScale+ MPSoC搭載開発キットを使用し、AMDのERNIC IPをプラットフォームに統合することで実現しました。Zynq UltraScale+ MPSoC開発キットは、高速QSFP-28コネクターを使用する100Gイーサネット・ソリューションのプロトタイピングと評価に適しています。
デモのセットアップ
システム・アーキテクチャ
Zynq UltraScale+ MPSoC内のプロセッシング・システム(PS)とプログラマブル・ロジック(PL)コンポーネントの間で実装が分割されている。PSにはARM Cortex-A53ベースのハードSoCが搭載され、システムの設定、制御、診断に使用されます。これには以下が含まれる:
AMD ERNIC IPは、RoCEv2スタックをFPGAにオフロードします。ERNICコントローラは、さまざまなモジュールとのハンドシェイクを管理してデータ転送を促進し、ワークキューエントリを生成してERNIC IPのドアベルを鳴らします。一方、Zynq UltraScale+ MPSoC 100G Ethernetサブシステムは、MAC層と物理層を処理する。さらに、データ・パターン・ジェネレーターは、生データとビデオ・データ・パターンの両方を生成する役割を担っている。
PTP (IEEE 1588 Standard)タイムスタンプは、イーサネットネットワーク上のシステム間の時刻同期に使用されます。PTPタイムスタンプは、ナノ秒レベルで同期された低遅延データ交換を提供することにより、リアルタイムアプリケーションのパフォーマンスを向上させます。
セットアップの主なハイライトは以下の通り:
Zynq UltraScale+ MPSoC 開発キットからサーバー PC へのビデオ データ転送の詳細なスループット統計を下表に示します。MPSoC開発プラットフォームは、100fps以上の8Kビデオと400fps以上の4Kビデオを受信します。
応用の可能性
コンバージド・イーサネットとERNIC IPを介したRDMAは、多様なアプリケーションや環境における接続性、パフォーマンス、効率を向上させ、複数の業界にわたって新たな機会と能力を引き出すことができます。そのようなアプリケーションのいくつかをここで紹介します:
より高速で効率的なデータ転送ソリューションへの需要が高まり続ける中、RDMA over Converged EthernetとERNIC IPは、ハイパフォーマンス・コンピューティングの未来を形作る上で極めて重要な役割を果たすことになるでしょう。