次のRTX40はRTX30より2倍高速ですか？

これは、次のNvidiaカードについてのその日の噂です。これらの新しいリークはKopte7kimiからのものであり、グリーンな次世代アーキテクチャのブロック図について説明しています。AD102「AdaLovelace」GPUブロック図の画像を使用すると、次のRTX40のパフォーマンスを予測できます。

RTX 40：印象的なスペック（trueの場合）

まず、Ada Lovelace AD102 GPUには最大12個のGPC（グラフィックスプロセッシングクラスター）が搭載されます。これは、7つのGPCしかないGA102（現在の範囲で最大）よりも70％多くなります。各GPUは、既存のチップの構成に一致する6つのTPCと2つのSMで構成されます。各SM（ストリーミングマルチプロセッサ）には、GA102GPUにも対応する4つのサブコアが含まれます。実際の変更は、FP32およびINT32コア構成です。各サブコアは128個のFP32ブロックで構成されますが、FP32 + INT32ブロックの合計は最大192個になります。これは、FP32ブロックがIN32ブロックと同じサブコアを共有しないためです。128個のFP32コアは、64個のINT32コアから分離されています。

Kopte7kimiによるRTX40GPUの概略画像の1つ。

キャッシュは、既存のAmpereGPUと比較してNVIDIAがすべてを使い果たしたもう1つの領域である必要があります。Ada Lovelace GPUには、SMあたり192KBのL1キャッシュが含まれ、Ampereよりも50％多くなります。これにより、最上位のAD102GPUに合計4.5MBのL1キャッシュが追加されます。L2キャッシュは96MBに増加します。これは、いくつかのリークで定期的に言及されています。これは、6MBのL2キャッシュしかないAmpereGPUのほぼ16倍です。キャッシュはGPUによって共有されます。

リークが正しければ、AD102のL2キャッシュは96MBに指数関数的に増加します。ROPに関しては、このアーキテクチャには2倍のブロックがあり、正確にはGPCあたり32であるため、RTX4090の場合は合計384ROP、RTX3090の場合は112ROPになります。。

GPU特性の比較。AD102はRTX40ラインナップの頂点になります。

しかし、この技術データの乱交の後、どのようなメリットが期待できますか？

明らかに、正確なアイデアを得るにはまだ時期尚早ですが、これらの要素が確認された場合、テクニカルシートはアンペアと比較して大きな違いを示します。総括する：

X2 GPC（対アンペア）
50％多いコア（Ampereと比較して）
L1キャッシュが50％多い（Ampereと比較して）
16x L2キャッシュ（Ampereと比較して）
X2 ROP（アンペアと比較して）
第4世代テンソルコアと第3世代RTコア

しかし、実際のパフォーマンスに関して何を期待できますか？

重要なデータである動作周波数が欠落しているため、これは非常に困難です。

少し考えてみると、FP32のパワーを現在のGA102の2倍以上の90TFLOPSに設計することができます。ただし、TFLOPSを使用すると、サプライズが発生する場合もあります。彼らが生のパフォーマンスのアイデアを与える場合、彼らは「毎日」の使用で結果の偏った判断を決して許しません。RTX 30と比較してx2のx2.2のリークアナウンス…増加は明らかに、重要なようです。しかし、さらに決定するには、もう少し待つ必要があります。

RTX 40：印象的なスペック（trueの場合）

しかし、この技術データの乱交の後、どのようなメリットが期待できますか？

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル