これは、次のNvidiaカードについてのその日の噂です。これらの新しいリークはKopte7kimiからのものであり、グリーンな次世代アーキテクチャのブロック図について説明しています。AD102「AdaLovelace」GPUブロック図の画像を使用すると、次のRTX40のパフォーマンスを予測できます。
RTX 40:印象的なスペック(trueの場合)
まず、Ada Lovelace AD102 GPUには最大12個のGPC(グラフィックスプロセッシングクラスター)が搭載されます。これは、7つのGPCしかないGA102(現在の範囲で最大)よりも70%多くなります。各GPUは、既存のチップの構成に一致する6つのTPCと2つのSMで構成されます。各SM(ストリーミングマルチプロセッサ)には、GA102GPUにも対応する4つのサブコアが含まれます。実際の変更は、FP32およびINT32コア構成です。各サブコアは128個のFP32ブロックで構成されますが、FP32 + INT32ブロックの合計は最大192個になります。これは、FP32ブロックがIN32ブロックと同じサブコアを共有しないためです。128個のFP32コアは、64個のINT32コアから分離されています。
Kopte7kimiによるRTX40GPUの概略画像の1つ。
キャッシュは、既存のAmpereGPUと比較してNVIDIAがすべてを使い果たしたもう1つの領域である必要があります。Ada Lovelace GPUには、SMあたり192KBのL1キャッシュが含まれ、Ampereよりも50%多くなります。これにより、最上位のAD102GPUに合計4.5MBのL1キャッシュが追加されます。L2キャッシュは96MBに増加します。これは、いくつかのリークで定期的に言及されています。これは、6MBのL2キャッシュしかないAmpereGPUのほぼ16倍です。キャッシュはGPUによって共有されます。
リークが正しければ、AD102のL2キャッシュは96MBに指数関数的に増加します。ROPに関しては、このアーキテクチャには2倍のブロックがあり、正確にはGPCあたり32であるため、RTX4090の場合は合計384ROP、RTX3090の場合は112ROPになります。 。
GPU特性の比較。AD102はRTX40ラインナップの頂点になります。
しかし、この技術データの乱交の後、どのようなメリットが期待できますか?
明らかに、正確なアイデアを得るにはまだ時期尚早ですが、これらの要素が確認された場合、テクニカルシートはアンペアと比較して大きな違いを示します。総括する :
- X2 GPC(対アンペア)
- 50%多いコア(Ampereと比較して)
- L1キャッシュが50%多い(Ampereと比較して)
- 16x L2キャッシュ(Ampereと比較して)
- X2 ROP(アンペアと比較して)
- 第4世代テンソルコアと第3世代RTコア
しかし、実際のパフォーマンスに関して何を期待できますか?
重要なデータである動作周波数が欠落しているため、これは非常に困難です。
少し考えてみると、FP32のパワーを現在のGA102の2倍以上の90TFLOPSに設計することができます。ただし、TFLOPSを使用すると、サプライズが発生する場合もあります。彼らが生のパフォーマンスのアイデアを与える場合、彼らは「毎日」の使用で結果の偏った判断を決して許しません。RTX 30と比較してx2のx2.2のリークアナウンス…増加は明らかに、重要なようです。しかし、さらに決定するには、もう少し待つ必要があります。
コメントを残す