次のRTX40はRTX30より2倍高速ですか?

次のRTX40はRTX30より2倍高速ですか?

これは、次のNvidiaカードについてのその日の噂です。これらの新しいリークはKopte7kimiからのものであり、グリーンな次世代アーキテクチャのブロック図について説明しています。AD102「AdaLovelace」GPUブロック図の画像を使用すると、次のRTX40のパフォーマンスを予測できます。

RTX 40:印象的なスペック(trueの場合)

まず、Ada Lovelace AD102 GPUには最大12個のGPC(グラフィックスプロセッシングクラスター)が搭載されます。これは、7つのGPCしかないGA102(現在の範囲で最大)よりも70%多くなります。各GPUは、既存のチップの構成に一致する6つのTPCと2つのSMで構成されます。各SM(ストリーミングマルチプロセッサ)には、GA102GPUにも対応する4つのサブコアが含まれます。実際の変更は、FP32およびINT32コア構成です。各サブコアは128個のFP32ブロックで構成されますが、FP32 + INT32ブロックの合計は最大192個になります。これは、FP32ブロックがIN32ブロックと同じサブコアを共有しないためです。128個のFP32コアは、64個のINT32コアから分離されています。

                    Kopte7kimiによるRTX40GPUの概略画像の1つ。

キャッシュは、既存のAmpereGPUと比較してNVIDIAがすべてを使い果たしたもう1つの領域である必要があります。Ada Lovelace GPUには、SMあたり192KBのL1キャッシュが含まれ、Ampereよりも50%多くなります。これにより、最上位のAD102GPUに合計4.5MBのL1キャッシュが追加されます。L2キャッシュは96MBに増加します。これは、いくつかのリークで定期的に言及されています。これは、6MBのL2キャッシュしかないAmpereGPUのほぼ16倍です。キャッシュはGPUによって共有されます。

リークが正しければ、AD102のL2キャッシュは96MBに指数関数的に増加します。ROPに関しては、このアーキテクチャには2倍のブロックがあり、正確にはGPCあたり32であるため、RTX4090の場合は合計384ROP、RTX3090の場合は112ROPになります。 。

                    GPU特性の比較。AD102はRTX40ラインナップの頂点になります。

しかし、この技術データの乱交の後、どのようなメリットが期待できますか?

明らかに、正確なアイデアを得るにはまだ時期尚早ですが、これらの要素が確認された場合、テクニカルシートはアンペアと比較して大きな違いを示します。総括する :

  • X2 GPC(対アンペア)
  • 50%多いコア(Ampereと比較して)
  • L1キャッシュが50%多い(Ampereと比較して)
  • 16x L2キャッシュ(Ampereと比較して)
  • X2 ROP(アンペアと比較して)
  • 第4世代テンソルコアと第3世代RTコア

しかし、実際のパフォーマンスに関して何を期待できますか?

重要なデータである動作周波数が欠落しているため、これは非常に困難です。 

少し考えてみると、FP32のパワーを現在のGA102の2倍以上の90TFLOPSに設計することができます。ただし、TFLOPSを使用すると、サプライズが発生する場合もあります。彼らが生のパフォーマンスのアイデアを与える場合、彼らは「毎日」の使用で結果の偏った判断を決して許しません。RTX 30と比較してx2のx2.2のリークアナウンス…増加は明らかに、重要なようです。しかし、さらに決定するには、もう少し待つ必要があります。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です