Intel hat seine neuesten Desktop-Grafikkarten, die Arc B580 und Arc B570, die auf der Battlemage-Architektur basieren, endlich offiziell vorgestellt, was wir aufgrund von Gerüchten in den letzten Tagen erwartet haben, obwohl die ersten konkreten Informationen über die Arc B570 etwas spät kamen. Wie auch immer, die wichtigsten Details zu den neuen Grafikkarten sind nun endlich ans Licht gekommen, einschließlich der internen Testergebnisse des Herstellers, aber unabhängige Tests müssen noch etwas länger warten: die Arc B580 wird in etwas mehr als einer Woche erhältlich sein, während die Arc B570 erst am 16. Januar 2025 verfügbar sein wird, so dass die ersten Tests erst dann verfügbar sein werden.
Wir werfen zunächst einen Blick auf die technischen Daten der ersten Modelle, dann auf die Ergebnisse der internen Tests und schließlich auf das, was sich unter der Haube getan hat, sowie auf die Software-Innovationen.
Die wichtigsten Merkmale des Arc B580 und Arc B570
Die beiden neuen Grafikkarten basieren beide auf dem BMG-G21-Grafikprozessor, der auf der Battlemage-Architektur basiert. Dieser enthält insgesamt 19,6 Milliarden Transistoren mit einer Chipfläche von 272 Quadratmillimetern und einer TSMC N5-Waferbreite für die Fertigungstechnologie. In beiden Fällen ist die GPU mit GDDR6 VRAM gekoppelt, wobei unterschiedliche Breiten von Speicherdatenbytes verwendet werden, während die Grafikkarte über eine PCI Express 4.0 x8-Schnittstelle mit dem Motherboard des Systems verbunden ist.
Die Anzahl der aktiven Xe2-Kerne auf der Arc B580 beträgt 20, was 2560 Stream Units ermöglicht, während die Anzahl der XMX-Kerne 160 und die Anzahl der RT-Kerne 20 beträgt. Referenzversionen der neuen Grafikkarte können mit GPU-Taktraten von 2670 MHz arbeiten, während die maximale GPU-Boost-Taktrate 2850 MHz beträgt - getunte Modelle arbeiten mit höheren Taktraten. Diese Version verfügt über einen 192-Bit-Speicherdatenstrom, der mit 12 GB GDDR6-VRAM mit 19 GHz gekoppelt ist, was wie erwartet eine Speicherbandbreite von 456 GB/s ergibt. Die neue Grafikkarte hat einen 190W TBP-Rahmen und einen offiziellen Listenpreis von 249$. Sie wird am 13. Dezember 2024 in den Regalen stehen.
Das andere neue Modell, der Arc B570, wird nur 18 aktive Xe2-Kerne haben, was 2304 Stream Units, 144 XMX-Kerne und 18 RT-Kerne bedeutet. Für diese GPU können wir eine Taktrate von 2500 MHz und eine GPU-Boost-Taktrate von 2750 MHz erwarten. Die Speicherdatenbusbreite ist dieses Mal auf 160 Bit reduziert, was in Verbindung mit 10 GB GDDR6 VRAM mit 19 GHz zu einer Speicherbandbreite von 380 GB/s in der Spitze führt, was auch aus Gerüchten bekannt war. Diese Grafikkarte verwendet nur noch einen 150W TBP-Rahmen und hat einen Listenpreis von $219. Sie wird voraussichtlich ab dem 16. Januar 2025 erhältlich sein.
Beide neuen Grafikkarten werden mit einem einzigen achtpoligen PCI-Express-Stromanschluss ausgestattet sein, und beide werden drei DisplayPort 2.1- und einen HDMI 2.1-Videoausgang haben. Der DisplayPort 2.1-Anschluss wird UHBR13.5 unterstützen, was zu einer maximalen Datenübertragungsbandbreite von 54 Gbps führt.
Ergebnisse der internen Tests
Laut Intel ist der Arc B580 im Durchschnitt 24 % schneller als der Arc A750 Limited Edition, was sich eigentlich nicht schlecht anhört. Die Tests wurden bei einer Auflösung von 1440p durchgeführt, und das ist die Auflösung, die für die GeForce RTX 4060 verwendet wird, obwohl diese Grafikkarte eigentlich 1080p darstellen sollte, was nicht wirklich an der GPU-Leistung liegt, sondern eher an den Einschränkungen von 8 GB VRAM.
Im Falle der Arc A750 hatten 20 der 47 getesteten Spiele XeSS-Unterstützung und diese Funktion war aktiviert, was in diesem Vergleich absolut kein Problem darstellt, da zwei Intel-Grafikkarten unter identischen Bedingungen verglichen wurden. Die Ergebnisse zeigten, dass 31 Spiele Geschwindigkeitssteigerungen zwischen 18% und 42% aufwiesen, aber es gab auch Titel, bei denen die neue Karte einen Vorteil von 78% hatte und andere, bei denen sie genauso gut abschnitt wie ihr Vorgänger - wie League of Legends und DOTA2, die mit CPU-Limitierungen zu kämpfen hatten.
In der nächsten Runde trat die GeForce RTX 4060 gegen den Neuling an, und die Messungen ergaben, dass der Neuling im Durchschnitt 10 % schneller war, natürlich in 47 Spielen und auch gegen die Arc A750. Allerdings war hier weder XeSS- noch DLSS-Unterstützung aktiv, so dass die rohe Leistung ohne jegliche Hochskalierung gemessen wurde, was durchaus fair ist. Die Leistung schwankte bei jedem Spiel ziemlich stark, wobei einige Spiele einen Nachteil von 17 % und andere einen Vorteil von bis zu 43 % gegenüber der GeForce RTX 4060 zeigten. Insgesamt sahen wir in sechs Spielen einen Leistungsnachteil von mehr oder weniger, während wir in 10 Spielen einen Leistungsvorteil von mehr als 20% für das Arc B580 sahen. Basierend auf früheren unabhängigen Tests sollte Intels Newcomer in etwa auf dem Leistungsniveau der Radeon RX 7600 XT liegen.
In Bezug auf die Preisgestaltung scheinen die 249 US-Dollar wettbewerbsfähig zu sein, da sie auf Augenhöhe mit der 8-GB-Radeon RX 7600 sind, während Nvidia nicht wirklich einen modernen Konkurrenten hat, da in dieser Preisklasse typischerweise nur GeForce RTX 30-Grafikkarten der vorherigen Generation zu finden sind, was nur möglich ist, wenn es eine ausreichende Menge an Lager gibt.
Insgesamt scheint dies keine katastrophale Ausgangssituation zu sein, aber es sollte bedacht werden, dass die Mitglieder der GeForce RTX 50- und AMD Radeon RX 8000-Serie bald veröffentlicht werden könnten, so dass sich Intels Marktchancen erheblich ändern könnten. Das Unternehmen hat noch keine internen Ergebnisse für den Arc B570 veröffentlicht, aber hoffentlich werden diese bald veröffentlicht.
Änderungen auf GPU-Ebene im Vergleich zur Alchemist-Serie
Die dGPUs der Battlemage-Serie basieren auf der Xe2-HPG-Architektur und nicht auf der Xe2-LPG-Architektur der Lunar Lake-Mobilprozessoren, was im Vergleich zur Alchemist-Generation erhebliche Änderungen mit sich bringt. Die erste Schwalbe, der BMG-G21-Grafikprozessor, wird mit der N5-Fertigungstechnologie von TSMC mit EUV-Schichten hergestellt und besteht aus insgesamt 19,6 Milliarden Transistoren auf einer Fläche von 272 Quadratmillimetern. Die "vollwertige" Version des Grafikprozessors verfügt über 20 Xe2-Kerne, die in insgesamt 5 Render Slices verfügbar sind, von denen jeder 4 Xe-Kerne hat. Soweit wir wissen, kann dies als vollwertige Version bezeichnet werden, da etwas darauf hindeutet, dass die neue dGPU physisch mehr Komponenten enthalten könnte, aber dies wird durch zukünftige Tests bestätigt oder dementiert.
An Bord jedes Xe2-Kerns befinden sich 8 512-Bit-Vektor-Engines und 8 2048-Bit-XMX-Matrix-Engines. Die Kapazität des gemeinsam genutzten L1-Cache wurde im Vergleich zur Alchemist-Serie um 33 % erhöht, von 192 KB auf 256 KB, und auch der L2-Cache wurde von 16 MB auf 18 MB vergrößert. Eine wichtige Änderung ist, dass die SIMD16-Unterstützung nun von den arithmetischen Logikeinheiten (ALUs) anstelle von SIMD32 verwendet wird. Laut Intel ist dies eine gute Wahl, da es einfacher ist, 16 Verarbeitungseinheiten mit SIMD16 zuverlässig und effizient mit Daten zu beladen als 32 Steckplätze mit dem früheren SIMD32, was die GPU-Auslastung verbessert und zu einer besseren Gesamtleistung führt.
Die unterstützten Datentypen haben sich dieses Mal geändert, mit der Hinzufügung von INT2- und TF32-Unterstützung, von denen ersterer die Rechenleistung für sehr kleine Ganzzahlen im Vergleich zu INT4 verdoppeln kann, während der TF32 besonders für verschiedene KI-bezogene Workflows nützlich ist, da er den gleichen Bereich wie der FP32 verwendet, jedoch mit geringerer Genauigkeit und geringeren Anforderungen an die Speicherbandbreite, was für diesen Bereich von Vorteil sein kann.
An der KI-Front wurde übrigens auch berichtet, dass die Arc B580 bei der Arbeit mit LLMs 40-50% besser abschneiden soll als die GeForce RTX 4060, was eigentlich gar nicht so schlecht klingt. Es wurde nicht verraten, wie die Leistung im Vergleich zu RDNA 3-basierten Produkten sein wird, aber wir sollten es spätestens mit der Veröffentlichung unabhängiger Tests herausfinden.
Im Battlemage ist jetzt eine dreifache Befehlsausführung möglich, d. h. ein XMX-Befehl, eine Ganzzahl-/Erweiterte-Mathematik-Operation und eine Gleitkomma-Operation können in jedem Zyklus unabhängig voneinander ausgeführt werden.
Die Raytracing-Kerne wurden ebenfalls hinzugefügt, wobei die Versionen der zweiten Generation nun eine Leistungssteigerung von 50 % bis 100 % erreichen, da sie dank der drei BVH-Traversal-Pipelines insgesamt 18 Box-Intersections pro Taktzyklus und 2 Triangle-Intersections verarbeiten können. Bei Alchemist waren es 12 bzw. 1. Die Verbesserung ist also signifikant, und die Tatsache, dass die Kapazität des dedizierten BVH-Cache auf 16 KB verdoppelt wurde, ist ebenfalls ein großes Plus.
Der Speicherdatenbus wird beim B580 192 Bit und beim B570 160 Bit betragen, was zusammen mit dem 19 GHz On-Board-Speicher zu Speicherbandbreiten von 456 GB/s bzw. 380 GB/s führt. Dies ist sicherlich ein Rückschritt im Vergleich zum Arc A580 und Arc A750, die noch eine Speicherbandbreite von 512 GB/s hatten, aber im Gegenzug haben beide mehr als 8 GB VRAM, was bedeutet, dass 12 GB und 10 GB VRAM bei Spielen weniger ein limitierender Faktor sein werden, während 8 GB VRAM bei vielen Spielen ein limitierender Faktor sein kann, und dies könnte in Zukunft noch zunehmen.
XeSS-Neuheiten
Die XeSS-Technologie, die der GPU hilft, Inhalte in einer niedrigeren als der nativen Auflösung zu rendern und dann die gerenderten Bilder über ein neuronales Netzwerk auf KI-Basis auf die native Auflösung hochzuskalieren, wurde erneut verbessert. Die unter dem Namen XeSS 2 laufende Version umfasst jetzt nicht nur Super Resolution (SR), sondern auch Frame Generation (FG) und Low Latency (LL).Die Funktion "Frame Generation" verwendet Optical Flow Re-Projection und Motion-Vector Re-Projection, um einen relevanten interpolierten Frame zwischen zwei Frames zu erstellen, wodurch die Basis-FPS bei fast jeder Super Resolution-Einstellung und sogar bei nativer Auflösung fast verdoppelt werden können.
Diese Funktion ist eher mit Nvidias DLSS 3 Frame Generation Technologie als mit AMDs FSR 3 vergleichbar. Um XeSS-FG zu nutzen, müssen Sie auch die latenzreduzierende XeSS-LL-Funktion verwenden. Das ist eigentlich keine große Überraschung, denn DLSS3 erfordert auch die Relfex-Technologie, während FSR3 über Anti-Lag 2 verfügt, um die Latenz zu reduzieren, die sich durch die zusätzlichen eingefügten Frames erhöht.
Intel-Experten haben ein konkretes Beispiel gezeigt, wie sich die Latenz bei F1 24 entwickeln kann. Normalerweise betrug die Latenzzeit 57 ms, die durch die Aktivierung von XeSS-LL, das das Rendering-Band modifiziert, um es kompakter und effizienter zu machen, auf 32 ms reduziert wurde.
Nach dem Ausschalten von XeSS-LL und der Aktivierung von XeSS-SR, dem Skalierungsmodus, verringerte sich die Latenzzeit auf 28 ms, und sobald XeSS-LL wieder eingeschaltet wurde, verringerte sich die Latenzzeit sogar noch weiter auf genau 19 ms. Das Einschalten aller drei Technologien zusammen ergab die gleiche Latenz wie SR allein, nämlich 28 ms, aber die FPS stiegen von 93 FPS auf 152 FPS. Sie können also entscheiden, was in einer bestimmten Situation wichtiger ist, und die Einstellungen entsprechend anpassen. Die XeSS-LL-Technologie zur Latenzreduzierung wird von spezieller Hardware zur Messung der Latenz begleitet.
Die XeSS-Technologie selbst entwickelt sich dynamisch weiter. XeSS 1 wird inzwischen in mehr als 150 Spielen verwendet, aber XeSS 2 erfordert die Arbeit von Entwicklern, um es zu unterstützen, da XeSS-FG und XeSS-LL in Spiele implementiert werden müssen, um zu funktionieren. Es wird erwartet, dass zunächst acht Spiele in naher Zukunft XeSS 2-Unterstützung erhalten werden und später weitere Titel hinzukommen werden.
Erscheinungsdatum und Preise
Die Intel Arc B580 wird am 13. Dezember 2024 erscheinen und einen Listenpreis von $249 haben. Ein Referenzmodell dieser Grafikkarte wird vom Intel-Team produziert und ebenfalls als Limited Edition gekennzeichnet sein. Die Intel Arc B570 wird erst ab dem 16. Januar 2025 erhältlich sein und 219 US-Dollar kosten. Von dieser Version wird es keine Limited Edition geben, sondern nur Modelle, die von AIB-Partnern entwickelt und hergestellt werden.