Intel Ponte Vecchio を搭載した Aurora スーパーコンピューター、エクサスケール レースで全 AMD フロンティアに勝つことができなかった

Intel Ponte Vecchio を搭載した Aurora スーパーコンピューター、エクサスケール レースで全 AMD フロンティアに勝つことができなかった

昨日、Top500.org は地球上で最速のスーパーコンピューターのリストを発表しましたが、Intel の Aurora スーパーコンピューターは、完全に動作する唯一のエクサフロップス マシンである AMD の Frontier に勝つことができなかったようです

Zettascale のことは忘れてください。インテルは、Aurora スーパーコンピューターと Ponte Vecchio チップ、オール AMD フロンティアによる地球上で唯一の Exaflop+ システムでエクサスケールのパフォーマンスをまだ達成していません。

米国イリノイ州のアルゴンヌ・リーダーシップ・コンピューティング施設にあるオーロラ・スーパーコンピューターに電力を供給するインテルのポンテ・ヴェキオ・アクセラレーターは現在稼働しているが、システムは予想される計算出力の4分の1で動作しているため、約束された計算パフォーマンスの達成にはほど遠い。実際のパフォーマンスと実際の効率の両方の点で、AMD Frontier システムは Intel の Aurora システムを上回っています。

以下は、地球上で上位 3 つのスーパーコンピューターです。

  • Frontier は TOP500 で引き続き No.1 システムです。この HPE Cray EX システムは、1 Exaflop/s を超えるパフォーマンスを備えた最初の米国システムです。この装置は米国テネシー州のオークリッジ国立研究所 (ORNL) に設置されており、エネルギー省 (DOE) によって運営されています。現在、8,699,904 コアを使用して 1.194 Exaflop/s を達成しています。HPE Cray EX アーキテクチャは、HPC および AI 向けに最適化された第 3 世代 AMD EPYC CPU と、AMD Instinct 250X アクセラレータおよび Slingshot-11 インターコネクトを組み合わせています。
  • Aurora は、システム全体の半分で測定された 585 Pflop/s の HPL スコアを提出し、2 位の座を獲得しました。これは、米国イリノイ州のアルゴンヌ リーダーシップ コンピューティング施設に設置されており、エネルギー省 (DOE) によっても運営されています。この新しいインテル システムは、HPE Cray EX (インテル エクサスケール コンピューティング ブレード) に基づいています。Intel Xeon CPU Max シリーズ プロセッサ、Intel Data Center GPU Max シリーズ アクセラレータ、および Slingshot-11 インターコネクトを使用します。
  • 新しい No. 3 システムである Eagle は、Microsoft によって Azure クラウドにインストールされます。この Microsoft NDv5 システムは、Xeon Platinum 8480C プロセッサと NVIDIA H100 アクセラレータをベースにしており、561 Pflop/s の HPL スコアを達成しました。
画像出典: Top500

詳細から説明すると、Aurora スーパーコンピューターは、Intel Xeon Max「第 4 世代 Sapphire Rapids」と Data Center Max GPU「Ponte Vecchio」を組み合わせて利用しています。このシステムには合計 474 万 2000 個のコアが搭載されていますが、これはシステムで予想されていた最終的な数値よりもはるかに少ないです。このシステムは、FP64 のピーク コンピューティング パフォーマンス 585.34 PFLOP を出力しました。これは、唯一のエクサフロップ対応マシンである AMD ベースの Frontier のピーク パフォーマンス (Rmax) の半分未満であり、1,194 PFLOP に達します。このシステムは2022 年から運用されています。

効率の点では、Aurora スーパーコンピューターの Rpeak は 1059.33 PFLOP/s でピークに達し、Frontier スーパーコンピューターは 1,679.82 PFLOP/s でピークに達します。Aurora スーパーコンピューターのピーク消費電力は 24.6 MW ですが、これはシステム全体の数値であり、半分の仕様/ハードウェアで実行されている現在の構成ではありません。Frontier スーパーコンピューターの消費電力は 22.7 MW です。

Rピーク値は、CPU の公表されたクロック レートを使用して計算されます。システムの効率を高めるために、適用されるターボ CPU クロック レートを考慮する必要があります。

トップ500経由

オーロラが今のような状態にあることは驚くべきことではありません。システムは最終的に動作可能になりましたが、インテルが約束していた 2 エクサフロップスには程遠いです。この現在の状況は、Intel の Sapphire Rapids および Ponte Vecchio チップの大幅な遅れが原因の 1 つであり、AMD がエクサスケール レースで最初の座を獲得し、その座を 1 年間維持することになりました。Intel Aurora が初めて発表されたのは4 年前の 2019 年でした。

Aurora が最終的に 2 Exaflops のコンピューティングを実現するのがいつになるかは不明ですが、AMD は既にEl-Capitan として知られる 2 Exaflops+ システムを計画しており、これも来年には稼働する予定です。これは、HPC およびスーパーコンピューティング分野におけるインテルにとってさらなる打撃となるでしょう。

2023-11-14_19-29-412023-11-14_19-29-452023-11-14_19-29-482023-11-14_19-29-492023-11-14_19-29-512023-11-14_19-29-522023-11-14_19-29-532023-11-14_19-29-542023-11-14_19-29-55

Intel は、Dawn (英国ケンブリッジ大学) と SuperMuc-NG (LRZ、ドイツ) という 2 つの追加スーパーコンピューターを発表しました。同社はまた、Aurora ノードと Frontier および Polaris のパフォーマンス数値をいくつか共有しましたが、Top500 リストで全体のパフォーマンス数値を Frontier がリードしている場合、それらはあまり重要ではないと私は考えています。

AMD はすでに世界中で120 を超えるスーパーコンピューターをサポートすることで先頭に立っており、その強力な EPYC と、非常に強力に見える今後の Instinct 製品によって、そのリストはさらに拡大していくでしょう。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です