Kategorien

NVIDIAS RUBY-BASIERTER KI-BESCHLEUNIGER R100, JETZT MIT INTEGRIERTEM HBM4-SPEICHER, KANN ENDE 2025 ERSCHEINEN

Mehr und mehr Informationen über die nach Vera Rubin benannte Architektur werden hoffentlich in den kommenden Monaten durchsickern.
J.o.k.e.r
J.o.k.e.r
Nvidias Ruby-basierter KI-Beschleuniger R100, jetzt mit integriertem HBM4-Speicher, kann Ende 2025 erscheinen

Nvidia dominiert den KI-Beschleunigermarkt sehr selbstbewusst, was einen Marktanteil von weit über 80 % bedeutet. Die genaue Zahl variiert von Analyst zu Analyst, aber das ändert nichts an der Sache. Im Hintergrund arbeiten natürlich sowohl Intel als auch AMD hart daran, ihre eigenen Lösungen zu entwickeln, die es ihnen ermöglichen, Nvidia auf dem KI- und HPC-Markt etwas den Wind aus den Segeln zu nehmen, aber es wird nicht einfach sein. In der Zwischenzeit arbeitet das Entwicklungsteam von Nvidia hinter den Kulissen bereits an der nächsten Generation der Rubin-Architektur, die nach Vera Rubin benannt ist und in mehr als einer Hinsicht einen Wendepunkt im KI-Beschleunigersegment zu sein verspricht.

Branchengerüchten zufolge, die der bekannte Analyst Ming-Chi Kuo über die virtuellen Spalten von medium.com verbreitete, könnte die Massenproduktion von Nvidias KI-Beschleuniger der nächsten Generation R100 bereits Ende 2025 beginnen. Produkte, die auf dem neuen Grafikprozessor basieren, könnten schon bald darauf, Anfang 2026, in Serverkonfigurationen auf den Markt kommen, was bedeutet, dass die Chancen gut stehen, dass sie bereits Mitte 2026 das Segment der Rechenzentren erobern. Mit der neuen Entwicklung, dem R100-Beschleuniger, der auf der Ruby-Architektur aufbaut, konzentriert sich Nvidia Berichten zufolge derzeit auf die Verbesserung der Energieeffizienz, da die TDP für Blackwell-basierte Produkte recht hoch geworden ist. Es ist noch nicht klar, ob sie versuchen werden, die Leistung durch eine Verringerung des TDP-Rahmens zu erhöhen oder eine viel höhere Leistung bei gleichem TDP-Rahmen anzubieten und damit die Energieeffizienz zu erhöhen.

Der B200-Grafikprozessor, der die Blackwell-Serie antreibt, kann einen TDP-Rahmen von bis zu 1000 W haben, während der GB200 mit zwei B200-Grafikprozessoren und einem Grace-Prozessor einen TDP-Rahmen von bis zu 2700 W erreichen kann. Die Bedienung eines derart hohen Stromverbrauchs und einer derart hohen Wärmeentwicklung ist keine einfache Aufgabe und kann die Betreiber von Rechenzentren vor neue Herausforderungen stellen, da diese Systeme nicht nur über einige wenige, sondern über Hunderte oder Tausende von Beschleunigern verfügen und die Kühlung und Stromversorgung in solchen Mengen nicht einfach ist. Diese Situation wird wahrscheinlich durch die Verbreitung einer immer weiter skalierenden Kühlung verbessert werden, doch ist dies noch nicht sehr praktikabel.

Branchengerüchten zufolge, über die der bekannte Analyst Ming-Chi Kuo in den virtuellen Spalten von medium.com berichtet, könnte die Massenproduktion von Nvidias KI-Beschleuniger der nächsten Generation R100 bereits Ende 2025 beginnen. Produkte, die auf dem neuen Grafikprozessor basieren, könnten schon bald darauf, Anfang 2026, in Serverkonfigurationen auf den Markt kommen, was bedeutet, dass gute Chancen bestehen, dass sie bereits Mitte 2026 das Segment der Rechenzentren erobern. Mit der neuen Entwicklung, dem R100-Beschleuniger, der auf der Ruby-Architektur aufbaut, konzentriert sich Nvidia Berichten zufolge derzeit auf die Verbesserung der Energieeffizienz, da die TDP für Blackwell-basierte Produkte recht hoch geworden ist. Es ist noch nicht klar, ob sie versuchen werden, die Leistung durch eine Verringerung des TDP-Rahmens zu erhöhen oder eine viel höhere Leistung bei gleichem TDP-Rahmen anzubieten und damit die Energieeffizienz zu erhöhen.

Gerüchten zufolge sollen die neuen KI-Beschleuniger mit einer der Fertigungstechnologien der N3-Klasse von TSMC hergestellt werden, möglicherweise mit einer kundenspezifischen Version des N3P-Knotens, die auf die Bedürfnisse von Nvidia zugeschnitten werden kann. Theoretisch könnte der N2-Knoten von TSMC bis Ende 2025 einsatzbereit sein, aber N3P hat den Vorteil, dass er ausgereifter und kostengünstiger als N2 ist und aufgrund seiner Reife eine höhere Ausbeute aufweist. Daher könnte es sich für Nvidia insgesamt mehr lohnen, auf N3P zu setzen.

Da das Marktsegment für KI- und HPC-Beschleuniger derzeit boomt, ist es sehr wahrscheinlich, dass Nvidia die Ruby-basierten Beschleuniger auf der GTC 2025 im nächsten Jahr vorstellen wird, um den Marktteilnehmern rechtzeitig mitzuteilen, was sie von dem Hersteller zu erwarten haben, damit die Kunden sich auf die Ankunft der Produkte vorbereiten und ihre Bestellungen rechtzeitig aufgeben können.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang