Die Blackwell-Architektur von Nvidia ist sowohl bei Beschleunigern für den KI- und HPC-Markt als auch bei Grafikkarten der GeForce-Serie für Gamer an Bord. Das Unternehmen hat bereits KI-Beschleuniger vorgestellt, und die ersten Mitglieder der GeForce RTX 50-Serie werden voraussichtlich im vierten Quartal dieses Jahres debütieren, aber es besteht eine gewisse Unsicherheit darüber, wie viele neue Grafikkarten genau in diesem Jahr veröffentlicht werden.
Während das geklärt wird, lohnt es sich, einen Blick auf einige der neuesten Informationen zu werfen, die von dem bisher vertrauenswürdigen Leaker kopite7kimi stammen. Die unten aufgeführten Daten listen die Parameter auf, die für die Blackwell-GPUs verfügbar sind, die für jede Grafikkarte bei maximaler Auslastung vorgesehen sind. Jede Grafikkarte könnte also am Ende mit weniger Ressourcen in Form von CUDA-Kernen ausgestattet sein, wobei die anderen Parameter voraussichtlich unverändert bleiben.
Die Spitze des Sortiments könnte durch den GB202-Grafikprozessor repräsentiert werden, der sich an Bord des Top-Nachfolgers der GeForce RTX 4090 befinden könnte - angeblich GeForce RTX 5090 genannt. Die GPU wird insgesamt 192 SM-Arrays an Bord haben, die in 96 TPCs (Texture Processing Chips) gruppiert sind, die wiederum 12 GPCs (Graphics Processing Chips) bilden. Wenn die Anzahl der CUDA Kerne pro TPC für Blackwell unverändert bleibt, d.h. 256 wie bisher, wird der GB203 bei vollem Einsatz 24576 CUDA Kerne haben. Es ist unwahrscheinlich, dass die GeForce RTX 5090 in der Lage sein wird, all dies zu nutzen, vielleicht wird der volle Ausbau für eine GeForce RTX 5090 Ti reserviert, wenn eine ausreichende Anzahl fehlerfreier Chips zusammengebaut werden kann. Mehr als eine Stufe darüber ist es wahrscheinlicher, dass die Top-End-Karte für den ProViz-Markt die vollwertigen GPUs erhalten wird, da hier eine höhere Gewinnspanne zu erwarten ist. Die GB202-GPU kann über eine sehr massive 512-Bit-Speicheradresse mit dem On-Board-GDDR7-Speicher verbunden werden, der mit 28 GHz RMS taktet. Wenn dies der Fall ist, kann das Speichersubsystem eine Speicherbandbreite von 1792 GB/s zuweisen.
Az Nvidia Blackwell sorozatú gamer GPU-inak várható paraméterei
GPU/Parameter | Anzahl der GPC-Arrays | Anzahl der TPC-Blöcke pro GPC-Block | Anzahl der SM-Arrays | Anzahl der CUDA Kerne | Speicher-Datenbus | Speicher-Standard | Speicher-Bandbreite | Speicherkapazität |
GB202 | 12 | 8 | 192 | 24576 | 512-Bit | GDDR7 | 1792 GB/s (28 GHz) | 32 GB, 64 GB |
GB203 | 7 | 6 | 84 | 10752 | 256-Bit | GDDR7 | 896 GB/s (28 GHz) | 16 GB, 32 GB |
GB205 | 5 | 5 | 50 | 6400 | 192-Bit | GDDR7 | 672 GB/s (28 GHz) | 12 GB, 24 GB |
GB206 | 3 | 6 | 36 | 6144 | 128-Bit | GDDR7 | 448 GB/s (28 GHz) | 8 GB, 16 GB |
GB207 | 2 | 5 | 10 | 2560 | 128-Bit | GDDR6 | 288 GB/s (18 GHz) | 8 GB, 16 GB |
Eine Stufe tiefer liegt der GB203, der Nachfolger des AD103. Dieser Grafikprozessor hat jetzt eine wesentlich einfachere Architektur mit nur 84 SM-Blöcken in 42 TPCs, was ein Maximum von 10752 CUDA-Kernen ergibt. In dieser Version kann das Speichersubsystem nur 256-Bit-Datenbits verarbeiten, was zu einer Speicherbandbreite von 896 GB/s bei 28 GHz effektiver Taktrate führt.
Interessanterweise gibt es keinen GB204-Chip in der Pipeline, so dass der Nachfolger des AD104 der GB206 sein wird, der mit 50 SM-Blöcken, aufgeteilt in 25 TPCs, und maximal 6400 CUDA-Kernen ausgestattet ist, was ein wenig überraschend ist. Die GPU kann hier nur noch mit 192-Bit-Speicherdaten arbeiten, was in Verbindung mit 28-GHz-Speicherchips mit GDDR7 eine Speicherbandbreite von 672 GB/s ergibt.
Als Nächstes folgt die Mittelklasse-GPU GB206, die mit 36 SM-Blöcken und 16 TPCs ausgestattet ist, mit maximal 6144 CUDA-Kernen, so dass sie in dieser Hinsicht nicht weit hinter der GB205 zurückbleibt. Allerdings hat sich die Speicherdatenbreite von 192 Bit auf 128 Bit geändert, und wenn 28GHz GDDR7-Speicherchips angeschlossen werden, ist eine Speicherbandbreite von 448 GB/s möglich.
Die Einstiegsklasse kann mit dem GB207 bedient werden, der über deutlich weniger Ressourcen verfügt. Diese GPU enthält nur 10 SM-Arrays, was zu 2560 CUDA-Kernen führt. Der Speicherdatenbus wird ebenfalls 128 Bit betragen, aber es handelt sich nicht mehr um 28 GHz GDDR7, sondern nur noch um 18 GHz GDDR6 VRAM, was zu einer Speicherbandbreite von 288 GB/s führt.
Es wird erwartet, dass die neuen GPUs mit größeren Caches als ihre aktuellen Gegenstücke ausgestattet sein werden, was die Leistung des Speichersubsystems verbessern dürfte. Darüber hinaus werden Verbesserungen im Bereich Raytracing und Tensor-Kerne sowie in anderen Bereichen erwartet, in denen die neuen GPUs dank der Vorteile der neuen Architektur besser werden könnten. Gerüchten zufolge sollen die ersten Mitglieder der Blackwell-Serie im vierten Quartal dieses Jahres auf den Markt kommen.