Es sind Gerüchte über AMDs KI-Plattform der nächsten Generation aufgetaucht, die darauf hindeuten, dass die MI455X-basierten Helios-Racks erst mit erheblicher Verzögerung auf den Markt kommen könnten.
Der Grund dafür sind Produktionsverzögerungen, die auch dazu führen könnten, dass Partner ihre begehrten Helios-Rack-Systeme nicht erhalten. Laut SemiAnalysis könnte die Produktion der ersten MI455X UALoE72-Systeme aufgrund von Produktionsverzögerungen in der zweiten Jahreshälfte in geringer Stückzahl anlaufen, wobei die Massenproduktion irgendwann im zweiten Quartal 2027 beginnen könnte. Die genauen Gründe für die Verzögerung der Produktion wurden nicht genannt.
Anush Elangovan, Corporate Vice President der Softwareentwicklungsabteilung des Unternehmens, teilte der Öffentlichkeit mit, dass die Arbeiten weiterhin auf eine Veröffentlichung in der zweiten Hälfte des Jahres 2026 ausgerichtet sind. Natürlich gab er nicht an, ob die Massenproduktion in der zweiten Jahreshälfte beginnen wird, aber die Gegendarstellung lässt darauf schließen, dass dies der Fall sein wird.
Das Helios-Rack-System selbst wird über insgesamt 72 Instinct MI455X-KI-Beschleuniger verfügen, die insgesamt 31 TB On-Board-HBM4-Speicher zuweisen werden. Das System wird eine FP4-Rechenleistung von 2,9 exaFLOP/s haben, während die FP8-Rechenleistung bei hohen 1,4 exaFLOP/s liegen wird - ersteres ist wichtig für Deduktionsworkflows, letzteres für Trainingsworkflows. Die ersten Lösungen auf Rack-Ebene werden voraussichtlich mit UALink-Verbindungen ausgestattet sein, um eine effiziente Zusammenarbeit und kompromisslose Leistung zu gewährleisten.
Nach dem derzeitigen Stand der Dinge sieht es so aus, als würde die Infrastruktur zunächst auf UALink on Ethernet und nicht auf UALink speziell basieren, was eine geringere Leistung ermöglicht. Es ist nicht klar, ob UALink für die Verzögerung verantwortlich ist oder ob es andere Gründe dafür gibt, aber Astera Labs hat inzwischen bestätigt, dass der Produktionshochlauf von UALink-basierten Plattformen nicht 2026, sondern 2027 erfolgen soll. Hoffen wir, dass dies in Kürze geklärt wird - es ist nicht ausgeschlossen, dass diese besondere Situation zu einem Missverständnis über die Verzögerung geführt hat.
In der Zwischenzeit kommen die Arbeiten an den Plattformen der nächsten Generation beim Konkurrenten AMD besser voran, als sie sollten, was bedeuten könnte, dass sie den NVL72 VR200 3-6 Monate früher auf den Markt bringen könnten, was bedeutet, dass er bereits im zweiten Quartal dieses Jahres erhältlich sein könnte. Jensen Huang von Nvidia deutete bereits im Januar an, dass die Produktion der Vera Ruby-Plattform bereits im Gange sei. Angesichts der jüngsten Nachrichten ist es also möglich, dass Partner das neue Produkt früher als erwartet in die Hände bekommen könnten.
Mark Lipacis, Analyst bei Evercore ISI, glaubt, dass Nvidia sich die Tatsache zunutze gemacht hat, dass einige Zulieferer aufgrund von Lieferverboten nicht nach China liefern können, und ihre freien Kapazitäten genutzt hat, um den Produktentwicklungsprozess zu beschleunigen, was dazu geführt hat, dass Rubin dem Zeitplan um 3-6 Monate voraus ist. Daher wäre es nicht überraschend, wenn Rubin noch vor Ende des zweiten Quartals dieses Jahres mit der Auslieferung beginnen würde. Natürlich testen Hyperscaler bereits Vera-Prozessoren und Rubin-GPUs, und die Validierungsprozesse sind bereits im Gange.
Wenn Nvidia die NVL72 VR200-Plattform früher als erwartet ausliefern kann, während AMD die UALink-basierte Version der Helios-Rack-Plattform etwas verschieben muss, könnte dies bedeuten, dass Nvidia seine Führungsposition in den Segmenten KI-Beschleuniger und KI-Server weiter ausbauen kann und im Gegenzug dafür sorgt, dass Entwickler weiterhin seine Plattformen für ihre Modelle wählen.