Nvidia macht einen sehr wichtigen Schritt auf dem Servermarkt, auf dem das Unternehmen bisher mit seinen KI-Beschleunigern und seinen ARM-basierten Prozessor- und KI-Beschleunigerplattformen um Kunden geworben hat. Es ist geplant, dass die Komponenten der Vera-Rubin-Plattform der nächsten Generation, die aus einem Vera-Prozessor und einer Rubin-GPU besteht, nicht nur als kombinierte Plattform, sondern auch einzeln erhältlich sein werden. Dies ist eine große Sache, da ARM-basierte Nvidia-Prozessoren bisher nur und ausschließlich als Kerneinheit zusammen mit der GPU erhältlich waren.
Indem der Hersteller ab der Vera-Serie separate Prozessoren auf dem Servermarkt anbietet, tritt er im Wesentlichen in Konkurrenz zu Intels Xeon und AMDs Epyc-Serverprozessoren. Obwohl der Hersteller noch keine separaten Modelle angekündigt hat, wird es laut Geschäftsführer Jensen Huang mehrere Versionen der ARM-Prozessoren der Vera-Serie geben, um den unterschiedlichen Bedürfnissen der Partner gerecht zu werden.
Der Chip, aus dem der Vera-Prozessor besteht, ist im Wesentlichen ein monolithisches Design mit 88 Prozessorkernen und Spatial Multithreading-Unterstützung. Durch die gemeinsame Nutzung von Ressourcen kann ein vollwertiger Prozessor mit bis zu 176 Threads gleichzeitig arbeiten, was die Effizienz erhöht. Die gute Nachricht ist vielleicht, dass die benutzerdefinierten Prozessorkerne nativ FP8-Rechenaufgaben unterstützen, was bedeutet, dass sie auch direkt KI-bezogene Workflows ausführen können, obwohl solche Arbeiten auf GPU-Basis immer noch viel effizienter sein werden. Sollte dennoch Funktionalität benötigt werden, so kann diese im Rahmen einer 6x128-Bit-SVE2-Implementierung bereitgestellt werden.
Neben den Prozessorkernen braucht man natürlich auch genügend schnellen Systemspeicher, der in Form von LPDDR5x-Speicherchips mit einer maximalen Speicherbandbreite von bis zu 1,5 TB/s zur Verfügung steht, was für speicherintensive Aufgaben sehr nützlich sein wird. Es ist noch nicht klar, ob die neuen Erweiterungen mit klassischen Speicheroptionen verfügbar sein werden, d. h. ob sie mit DDR5 RDIMM-Speichermodulen oder nur mit LPDDR5x-Speicherchips in Form von SOCAMM-Modulen gepaart werden können. Dies könnte sich mit der Zeit herausstellen.
Auf dem monolithischen Chip sind die Prozessorkerne durch eine Scalable Coherency Fabric verbunden, die eine Datenbandbreite von 3,4 TB/s ermöglicht, was nicht nur eine hohe Geschwindigkeit, sondern auch eine niedrige Latenz gewährleistet. Die neuen Vera-Prozessoren können mit Nvidias KI-Beschleunigern über die NVLink-Technologie verbunden werden, insbesondere mit Modellen, die die Ruby-Architektur verwenden, die bis zu 1,8 TB/s Datenbandbreite für den Erfolg einsetzen kann.