Auf der Nvidia GTC Washington, D.C. 2025 wurden viele interessante Themen besprochen, und zwar während der eigentlichen Übertragung, nicht als Teil des parallel gestarteten Deepfake-Contents für Kryptowährungsbetrug, über den in dieser News berichtet. Unter anderem stellte der echte Jensen Huang die nächste Generation der Superchip-Plattform vor, die diesmal auf der Vera-Prozessorarchitektur und der Ruby-GPU-Architektur aufbaut und in mehreren Bereichen große Fortschritte bringen wird, von denen Betreiber von KI-Rechenzentren profitieren werden.
Die Plattform, die als ein einziges großes Motherboard geliefert wird, wird auf insgesamt drei Chips basieren: zwei Vera-GPUs, die jeweils aus zwei Chips bestehen, und ein Prozessor der Rubin-Serie, der auf der ARM-Architektur basiert und die GPUs bedient. Die GPUs verwenden natürlich HBM4 On-Board-Speicher, während der Systemspeicher aus LPDDR-Standardspeicherchips besteht. Nach Angaben von Nvidia wird die neue Plattform bereits vom Entwicklungsteam des Unternehmens getestet, die Serienproduktion wird jedoch erst im nächsten Jahr beginnen.
Grundsätzlich können wir zwei GPU-Chips an Bord jeder Rubin-GPU erwarten, die eine Rechenleistung von bis zu 50 PFLOP/s für FP4-Aufgaben erbringen können, sowie 288 GB HBM4-Speicher, der in Form von acht HBM4-res-Speicherchip-Sandwiches verfügbar sein wird. Diese GPUs werden von einer auf ARM basierenden Vera-CPU mit insgesamt 88 Kernen und 176 Threads bedient, die mit jeder Rubin-GPU über NVLINK-C2C-Links mit einer Datenübertragungsbandbreite von 1,8 TB/s kommuniziert.
Dieses Motherboard, das in etwa die Größe eines PC-Motherboards mit ATX-Formfaktor hat, kann eine maximale Rechenleistung von bis zu 3,6 ExaFLOP/s für FP4 - Deduktions - Aufgaben in NVL144-Rackform erreichen, während FP8 - Trainings - Operationen mit einer Rechenleistung von 1,2 ExaFLOP/s bedient werden können. Basierend auf dieser Leistung kann die neue NVL144-Konfiguration bis zu 3,3 Mal schneller sein als der GB300-basierte NVL72, was eine erhebliche Verbesserung darstellt. Das neue System verfügt über eine HBM4-Speicherbandbreite von 13 TB/s und umfasst außerdem 75 TB schnellen Systemspeicher. Die NVLINK- und CX9-Links verdoppeln die maximal verfügbare Datenbandbreite mit 260 TB/s bzw. 28,8 TB/s.
Auf das System, das 2026 auf den Markt kommt, folgt 2027 der NVL576 auf Rubin-Ultra-Basis, der denselben Prozessor auf der Grundlage der Vera-Architektur mit 88 Kernen und 176 Threads verwendet. Die Rubin-GPU wird jedoch durch die Rubin-Ultra-GPU ersetzt, die aus vier statt zwei Kernen besteht und eine maximale FP4-Rechenleistung von etwa 100 PFLOP/s erreichen kann. Die Vier-Karten-GPU wird von 1 TB HBM4e-Speicher begleitet, der in Form von 16 Speicherchip-Sandwiches erhältlich sein wird. Das NVL576-System soll eine maximale FP4-Rechenleistung von 15 ExaFLOP/s und eine maximale FP8-Rechenleistung von 5 ExaFLOP/s erreichen, mit 365 TB schnellem On-Board-Speicher und Kommunikation über einen NVLINK-Link mit einer Bandbreite von 1,5 PB/s.
Der nächste Schritt wird der Vera Feynman Superchip sein, der um das Jahr 2028 auf den Markt kommen könnte: Diese Entwicklung könnte neben der Vera-CPU eine Feynman-basierte GPU umfassen, die mit einem HBM-Speicherchip der nächsten Generation verbunden ist.