Laut aktuellen Berichten hat die Geschäftsführung von Nvidia die Produktion der AI-Beschleuniger der H200-Serie wahrscheinlich eingestellt, was jedoch die reibungslose Belieferung der chinesischen Partner nicht gefährdet, sofern die dafür erforderlichen Export- und Importlizenzen von den zuständigen Behörden der Vereinigten Staaten und Chinas erteilt werden.
In der letzten Zeit konnten erhebliche Lagerbestände der betreffenden AI-Beschleuniger angehäuft werden, da man davon ausging, dass China nach der Genehmigung des Exports durch die US-Regierung die neuen Lieferungen willkommen heißen würde. Letztendlich kam es jedoch nicht dazu, da die chinesische Regierung den Prozess blockierte, sodass kein einziger neuer H200-AI-Beschleuniger in das Land gelangen konnte, zumindest nicht über offizielle Kanäle. Die chinesische Seite machte die Einfuhr der H200-AI-Beschleuniger von der Beantragung einer Importlizenz abhängig, aber nach früheren Meldungen hat bisher kein großes chinesisches Unternehmen eine solche Lizenz erhalten, weshalb die auf dem TSMC N5-Knoten hergestellten H200-AI-Beschleuniger in den Lagern verblieben sind.
Die oben beschriebene Situation war zu erwarten, aber es ist überraschend, dass laut Financial Times und Reuters die Fertigungskapazitäten für H200-Chips gleichzeitig auf die KI-Beschleuniger der Ruby-Serie umgelenkt werden. Die beiden Generationen haben völlig unterschiedliche Grundlagen, sowohl in Bezug auf die Fertigung als auch auf die Chiptechnologie, so dass es keine wirkliche Überschneidung zwischen ihnen gibt. Die Hopper-basierten H200-Modelle verwenden TSMCs N5-Wafer der 5-nm-Klasse mit CoWoS-S-Technologie, während die Rubin-basierten Chips jetzt mit TSMCs 3-nm-Fertigungstechnologie hergestellt werden und auf der CoWoS-L-Technologie basieren. Die Umstellung von 5 nm auf 3 nm für Produktionslinien mit 5 nm Streifenbreite bringt erhebliche Veränderungen mit sich, aber die Umstellung der Chip-Beschichtungstechnologien ist bei CoWoS-S und CoWoS-L nicht so stark, so dass letztere wahrscheinlich von der "Umplanung" betroffen sind.
Hintergrund könnte sein, dass die zuvor von Nvidia reservierte N5-Produktionskapazität, die für die Herstellung der H200-GPUs benötigt wurde, wahrscheinlich ausgelastet war, d. h. TSMC hat die Verpflichtungen des Unternehmens erfüllt, und das Team von Nvidia hat den Auftrag offenbar nicht erweitert. Die frei werdende Kapazität, die in diesem Fall hauptsächlich Chip-Technologien betrifft, kann für die Herstellung von Vera Rubin VR200-Chips genutzt werden. Bei den N5-Knoten ist es jedoch unwahrscheinlich, dass ein Teil der Produktionslinien auf N3-Streifenbreite umgestellt wird, wenn mit N5 auch andere Partner bedient werden können. Da Nvidia nun jedoch der größte Kunde von TSMC ist, hat das Unternehmen sowohl in Bezug auf die Kapazitätsauslastung als auch auf individuelle Anforderungen mehr Mitspracherecht als zuvor: TSMC wird die gewünschten Änderungen wahrscheinlich gerne vornehmen, sofern sie im Rahmen des Sinnvollen bleiben und auch geschäftlich nachvollziehbar sind.