Kategorien

NVIDIA AN DER KI-FRONT: DER VERA RUBIN SUPERCHIP

Die neue Plattform bringt einen großen Schritt nach vorn bei der Rechenleistung.
J.o.k.e.r
J.o.k.e.r
Nvidia an der KI-Front: der Vera Rubin Superchip

Auf der Nvidia GTC Washington, D.C. 2025 wurden viele interessante Themen besprochen, und zwar während der eigentlichen Übertragung, nicht als Teil des parallel gestarteten Deepfake-Contents für Kryptowährungsbetrug, über den in dieser News berichtet. Unter anderem stellte der echte Jensen Huang die nächste Generation der Superchip-Plattform vor, die diesmal auf der Vera-Prozessorarchitektur und der Ruby-GPU-Architektur aufbaut und in mehreren Bereichen große Fortschritte bringen wird, von denen Betreiber von KI-Rechenzentren profitieren werden.

Galerie öffnen

Die Plattform, die als ein einziges großes Motherboard geliefert wird, wird auf insgesamt drei Chips basieren: zwei Vera-GPUs, die jeweils aus zwei Chips bestehen, und ein Prozessor der Rubin-Serie, der auf der ARM-Architektur basiert und die GPUs bedient. Die GPUs verwenden natürlich HBM4 On-Board-Speicher, während der Systemspeicher aus LPDDR-Standardspeicherchips besteht. Nach Angaben von Nvidia wird die neue Plattform bereits vom Entwicklungsteam des Unternehmens getestet, die Serienproduktion wird jedoch erst im nächsten Jahr beginnen.

Galerie öffnen

Grundsätzlich können wir zwei GPU-Chips an Bord jeder Rubin-GPU erwarten, die eine Rechenleistung von bis zu 50 PFLOP/s für FP4-Aufgaben erbringen können, sowie 288 GB HBM4-Speicher, der in Form von acht HBM4-res-Speicherchip-Sandwiches verfügbar sein wird. Diese GPUs werden von einer auf ARM basierenden Vera-CPU mit insgesamt 88 Kernen und 176 Threads bedient, die mit jeder Rubin-GPU über NVLINK-C2C-Links mit einer Datenübertragungsbandbreite von 1,8 TB/s kommuniziert.

Galerie öffnen

Dieses Motherboard, das in etwa die Größe eines PC-Motherboards mit ATX-Formfaktor hat, kann eine maximale Rechenleistung von bis zu 3,6 ExaFLOP/s für FP4 - Deduktions - Aufgaben in NVL144-Rackform erreichen, während FP8 - Trainings - Operationen mit einer Rechenleistung von 1,2 ExaFLOP/s bedient werden können. Basierend auf dieser Leistung kann die neue NVL144-Konfiguration bis zu 3,3 Mal schneller sein als der GB300-basierte NVL72, was eine erhebliche Verbesserung darstellt. Das neue System verfügt über eine HBM4-Speicherbandbreite von 13 TB/s und umfasst außerdem 75 TB schnellen Systemspeicher. Die NVLINK- und CX9-Links verdoppeln die maximal verfügbare Datenbandbreite mit 260 TB/s bzw. 28,8 TB/s.

Galerie öffnen

Auf das System, das 2026 auf den Markt kommt, folgt 2027 der NVL576 auf Rubin-Ultra-Basis, der denselben Prozessor auf der Grundlage der Vera-Architektur mit 88 Kernen und 176 Threads verwendet. Die Rubin-GPU wird jedoch durch die Rubin-Ultra-GPU ersetzt, die aus vier statt zwei Kernen besteht und eine maximale FP4-Rechenleistung von etwa 100 PFLOP/s erreichen kann. Die Vier-Karten-GPU wird von 1 TB HBM4e-Speicher begleitet, der in Form von 16 Speicherchip-Sandwiches erhältlich sein wird. Das NVL576-System soll eine maximale FP4-Rechenleistung von 15 ExaFLOP/s und eine maximale FP8-Rechenleistung von 5 ExaFLOP/s erreichen, mit 365 TB schnellem On-Board-Speicher und Kommunikation über einen NVLINK-Link mit einer Bandbreite von 1,5 PB/s.

Galerie öffnen

Der nächste Schritt wird der Vera Feynman Superchip sein, der um das Jahr 2028 auf den Markt kommen könnte: Diese Entwicklung könnte neben der Vera-CPU eine Feynman-basierte GPU umfassen, die mit einem HBM-Speicherchip der nächsten Generation verbunden ist.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang