Jedes Jahr versucht Arm neue Prozessorkerne anzubieten, und dieses Jahr war das Ziel eindeutig, die Geschwindigkeit deutlich zu erhöhen. Sie "schießen" nicht mehr nur auf Mobiltelefone, sondern wollen Geräte mit fortschrittlicher generativer KI an allen Fronten bedienen und auch für Notebooks eine geeignete Plattform bieten.
Es wurde viel Kritik an Armo geübt, weil es keine ausreichend leistungsfähigen CPU-Kern-IPs herstellt, weshalb das Unternehmen dachte, es würde zeigen, wie es das tun könnte, wenn es sich wirklich darauf konzentrieren würde. Der Arm Cortex-X925 kommt jetzt mit einem neuen Namensschema, da er der Nachfolger des Cortex-A4 ist. Er wird den IPC um 15% verbessern, aber darum geht es dem Unternehmen zufolge nicht, sondern darum, wie er die Chips in der Neuproduktion verbessern wird, und in diesem Bereich wird es eine große Veränderung geben.
Bis zu 46 Prozent mehr Leistung wird der Cortex-X925 in der neuen Generation von Systemchips bringen.
Arm hat die neuen CPU-Kern-IPs bereits für die 3nm-Waferbreite optimiert, in die das Unternehmen großes Vertrauen hat. Das Unternehmen sagte, dass der Umfang der Beschleunigung, der durch den Wechsel zu 3nm-Knoten erreicht wird, beispiellos sein wird. Auch die Effizienz und Skalierbarkeit wird sich durch Änderungen am Front-End und Back-End deutlich verbessern. Der Cortex-X925 auf 3nm wird sicher mit 3,6 GHz arbeiten können und zudem über einen größeren Cache verfügen. Er wird die Geschwindigkeit bei allgemeinen Anwendungen um 36 % und bei einigen KI-Funktionen um fast 50 % erhöhen.
Die Cortex-X925-CPU verfügt über sechs statt bisher vier SIMD-Einheiten, wodurch sie die Last paralleler mathematischer Berechnungen viel besser bewältigen kann, was für KI-Workflows ein großer Vorteil ist. Dies wird den größten Teil der Beschleunigung an dieser Front ausmachen. Arm hat die Größe des OoO-Befehlsfensters verdoppelt, was sich zum Beispiel positiv auf die Effizienz auswirken wird. Die L1-Caches werden mit der doppelten Bandbreite arbeiten, um sicherzustellen, dass alles mit der richtigen Geschwindigkeit und mit der geringstmöglichen Latenz läuft.
Insgesamt setzt der Cortex-X925 den Weg fort, den Arm mit dem Cortex-X4 eingeschlagen hat, mit nur geringen Änderungen. Der Cortex-A725 wird das Gegenstück zum X925 in verschiedenen Chipdesigns sein, und auch er zeigt eine schöne Leistungssteigerung, aber es wird nicht der gleiche Sprung sein wie die Top-CPU-Core-IP. Auch hier werden wir eine Vergrößerung des OoO-Befehlsfensters sehen, in Übereinstimmung mit dem Cortex-X925, und es wird eine neue L2-Cache-Konfiguration eingeführt, die höhere Geschwindigkeit und geringere Latenz verspricht, und auch der L3 wird um 20 % beschleunigt.
Insgesamt lässt sich feststellen, dass Arm beim Cortex-A725 den Schwerpunkt eher auf die Steigerung der Effizienz als auf die Leistung gelegt hat. Das Unternehmen sagt, dass die "Leistungseffizienz" nach dem Generationswechsel um 35% verbessert wird. Die Energieeffizienz wird sich um 25% verbessern.
Man spürt, dass Arm den Chipdesignern auch an dieser Front bereits in die Hände spielt und den Cortex-A725 in eine Richtung lenkt, die ihn sogar zu einem nahezu vollständigen Ersatz für stromsparende Kerne machen könnte. Immerhin verwendet MediaTek für den Dimensity 9300 derzeit ein Design, das auf stromsparende Prozessoren verzichtet. Für diesen Zweck wird der Cortex-A725 viel besser sein als die aktuellen Komponenten.
Arm hat auch den Cortex-A520-Prozessor aktualisiert, aber hier sind nur minimale Änderungen zu erkennen, so dass sich der Name nicht wirklich geändert hat. Die Architektur wurde von den Entwicklern nicht wirklich angetastet, die Optimierung war hier wichtiger, und damit haben sie eine ganz schöne Verbesserung beim Stromverbrauch erreicht.
In der Vergangenheit hat sich Arm in der Regel nicht die Mühe gemacht, die auf Effizienz ausgelegten Kerne, die seit vielen Jahren unverändert geblieben sind, für neuere Fertigungstechnologien zu optimieren. Das soll sich nun ändern, und das ist ein willkommener Schritt.
Neben den neuen Prozessorkernen ist auch die DynamIQ-Verbindungseinheit, die DSU-120, zu erwähnen, die zwar nicht neu ist, sich aber verändert hat. Der gemeinsam genutzte L3-Cache wurde von den Arm-Entwicklern um die Quick Nap-Funktion erweitert, die einen geringeren Verbrauch des L3-Caches und damit des gesamten Chipsatzes bei normaler täglicher Nutzung ermöglicht. Es gibt eine Menge kleinerer und größerer Verbesserungen zur Steigerung der Effizienz, denen es zum Teil zu verdanken ist, dass die Geschwindigkeit erhöht werden kann.
Arm arbeitet außerdem enger denn je mit TSMC und Samsung zusammen, um sicherzustellen, dass die neuen Designs wirklich hervorragend auf die neuen Fertigungsprozesse (z.B. GAA) abgestimmt sind. Dies wird auch den Chipdesignern die Arbeit erleichtern, die bereits jetzt ihre eigenen Chips mit hochoptimierten Komponenten entwickeln können.
Arm plant, mit den neuen Prozessorkernen Chipdesigns zu entwickeln, die in Notebooks eingesetzt werden können. Auch sehr leistungsfähige Konfigurationen werden möglich sein. Mit den neuen Chips wird es möglich sein, Systemchips mit bis zu 14 Kernen herzustellen. Es bleibt jedoch abzuwarten, welche Chipdesigner mit den neuen Entwicklungen in diese Richtung gehen werden.
Qualcomm hat bereits Chips für Laptops mit seinen eigenen CPU-Kernen entwickelt, und der Hauptpartner von Arm an dieser Front wird MediaTek sein. MTK soll auch mit Nvidia zusammenarbeiten, und daraus könnten sich noch interessante Entwicklungen ergeben.