Auf der Hot Chips 2025 enthüllte Nvidia die genaue Architektur des GB10 SuperChip, der in Zusammenarbeit mit MediaTek entwickelt wurde. Mit dem neuen Kern hat das Unternehmen im Wesentlichen die Rechenleistung und -fähigkeiten von Rechenzentren auf Desktop-Workstations übertragen und damit neue Möglichkeiten für Entwickler und Anwender geschaffen.
Der spezielle Chip kommt in Form eines Multi-Chiplet-Gehäuses, dessen eine Komponente ein von MediaTek entwickelter ARM-basierter Prozessorchip ist, während die andere ein spezieller Grafikprozessor ist, der wiederum von Nvidia stammt und auf der Blackwell-Architektur basiert. Die Chips an Bord werden auf TSMCs 3-nm-Waferbreite gefertigt und sind in 2,5D-Gehäusen untergebracht, was ihnen ein sehr modernes Design verleiht.
Die CPU-Sektion verfügt über insgesamt 20 ARM v9.2-basierte Prozessorkerne, die in zwei Zehn-Kern-Clustern mit 16 MB gemeinsamem Third-Level-Cache pro Cluster angeordnet sind, wobei jeder Prozessorkern auch seinen eigenen dedizierten Second-Level-Cache nutzen kann. Der mit insgesamt 32 MB gemeinsam genutztem Tertiär-Cache ausgestattete Chip verfügt über einen 256-Bit-Speicherdatenbus, der nicht nur die CPU, sondern auch den GPU-Teil des Chips bedient, mit LPDDR5X-9400 MT/s-Speicherchips bis zu 128 GB, mit einer effektiven Speicherbandbreite von rund 300 GB/s. Die Controller für die Hochgeschwindigkeits-I/O-Konnektivität befinden sich auf dem CPU-Board, so dass PCIe-NVMe-basierte Speicher und ConnextX-7-NICs an Bord sein können - letztere über PCI Express 5.0 x8.
Die GPU ist eine Spezialentwicklung auf Basis der Blackwell-Architektur, die jedoch für Desktop-Konfigurationen mit kleinem Formfaktor und geringerem Stromverbrauch optimiert ist und eine begrenzte, aber dennoch sehr hohe Leistung aufweist. Die GPU ist in der Lage, etwa 31 TFLOP/s an Single-Precision-Rechenleistung zu erreichen, während Nvidias NVFP4-Format bis zu 1000 TOPs an Rechenleistung liefern kann, was besonders für KI-Anwendungen nützlich ist. Die GPU verfügt über einen recht großen 24 MB großen Second-Level-Cache, der als übergeordneter, für die CPU sichtbarer Cache fungiert und eine cache-kohärente Hierarchie zwischen den beiden Karten ermöglicht.
Laut Nvidia ermöglicht der C2C-Link zwischen den Chips eine Gesamtbandbreite für den Datentransfer von ca. 600 GB/s bei geringer Latenz, so dass die gemeinsame Nutzung von Daten effizient und schnell erfolgen kann. Mit einer TDP von 140 W bietet das Board eine Reihe professioneller Funktionen für Sicherheit und Virtualisierung und kann dank DisplayPort Alternate Mode und HDMI 2.1a-Unterstützung mit mehreren Displays umgehen.
Der betreffende Chip ist in Form von DGX Spark erhältlich, das auf DGX Base OS läuft und in der Lage ist, das KI-Framework des Unternehmens lokal auszuführen. Workflows, die mit dem Gerät erstellt werden, können später auf leistungsstärkere DGX-Systeme skaliert oder sogar auf Server in der Cloud portiert werden, was bedeutet, dass DGX Spark als eine Art Inkubator fungiert.
Die Konfiguration ist zu einem Listenpreis von 3999 US-Dollar erhältlich, und der GB10-Superchip an Bord wird wahrscheinlich in nicht allzu ferner Zukunft in leicht überarbeiteter Form in Form von N1- und N1x-SoC-Einheiten auf dem Verbrauchermarkt erscheinen, zumindest legen das die bisherigen Gerüchte nahe. Der Chip wird genügend CPU- und GPU-Leistung bieten, um Consumer-Notebooks und kompakte Desktops zu bedienen, und könnte sogar an Bord mobiler Workstations eingesetzt werden.