Igor's Lab wies vor kurzem auf einen interessanten Fehler hin , da sie von einem ihrer Leser eine Grafikkarte der Serie Radeon RX 9070 XT erhielten, die sich seltsam verhielt und einen größeren Unterschied als üblich zwischen dem Hot Spot auf der GPU und den normalen Betriebstemperaturbereichen aufwies, Dies wirkte sich auf die Leistung der Grafikkarte aus und löste den Drosselungsprozess aus, um die Leistung des Grafikprozessors zu reduzieren und die Temperatur wieder auf ein akzeptables Niveau zu bringen. Offensichtlich hat der Neustart der GPU nichts an dem seltsamen Verhalten geändert.
Es ist erwähnenswert, dass es sich immer noch um einen Einzelfall handelt. Es ist möglich, dass weitere GPUs mit ähnlichen Fehlern die Produktionslinie nicht verlassen haben, aber wenn es sich um einen Herstellungsfehler handelt, könnte eine ganze Charge von GPUs betroffen sein, was sicherlich später entdeckt werden wird, wenn dies der Fall ist. Vorläufig sollten die folgenden Symptome als Einzelfälle behandelt werden.
Laut Igor's Lab wird das Problem durch winzige Krater auf der Oberfläche des GPU-Siliziumwafers verursacht, die zu einer extremen Überhitzung von Teilen der GPU führen können, wo die Wärme nicht effizient abgeleitet werden kann. Dies kann zu einem extrem großen Temperaturunterschied von bis zu 46 Grad Celsius zwischen Bereichen des Grafikprozessors mit annähernd gleichmäßigen Temperaturen und Hot Spots führen, wobei Hot Spots bis zu 113 Grad Celsius erreichen, was ein Problem darstellt. Der obere Grenzwert für die Betriebstemperatur liegt standardmäßig bei 110 Grad Celsius, und wenn höhere Temperaturen festgestellt werden, wird der oben erwähnte Drosselungsprozess ausgelöst.
Die winzigen Krater sind mit bloßem Auge nicht zu erkennen, aber unter dem Mikroskop sind sie gut sichtbar. Bei der Inspektion der Oberfläche des Grafikprozessors wurden mehr als 1934 dieser winzigen Krater gefunden, die zusammen mehr als 1 % der gesamten Chipoberfläche ausmachen und eine sehr große Fläche abdecken, was sich verständlicherweise auf die Leistung des Chips in Bezug auf die Betriebstemperaturen und die daraus resultierende Überhitzung auswirkt.
Im Fall der PowerColor Radeon RX 9070 XT Hellhound liegen Anzahl und Größe der Mikrogitter auf der GPU-Oberfläche jenseits dessen, was Igor's Lab für Qualitätskontrollzwecke für akzeptabel hält. Grundsätzlich werden Mikrogitter, die nicht tiefer als 5-10 Mikrometer und nicht größer als 50-100 Mikrometer im Durchmesser sind, akzeptiert, vorausgesetzt, sie befinden sich nicht an den Rändern des Chips oder in Bereichen, in denen die Stabilität der Verbindungen beeinträchtigt wird. Bei dünnen Wafern oder Wafern, deren Oberfläche vor allem aufgrund der thermischen Ausdehnung hohen mechanischen Belastungen ausgesetzt ist, kann ein Krater von mehr als 2-3 Mikrometern Tiefe kritisch sein.
Der größte entdeckte Krater war 12,59 Mikrometer tief und hatte einen Durchmesser von 212,36 Mikrometern, Werte, die über den Richtlinien und Größenbeschränkungen der Industrie liegen.
Was könnte die Krater verursacht haben? Während des Herstellungsprozesses werden Siliziumwafer auf der Rückseite "geschliffen", um die für die Chipstruktur erforderliche Dicke zu erreichen, wobei darauf geachtet wird, dass die endgültige Oberfläche ausreichend glatt und fehlerfrei ist. Wie beim Schleifen können auch bei dieser Art des "Schleifens" Defekte wie Kratzer, Krater oder andere Beschädigungen auftreten, z. B. durch Verunreinigung der Oberfläche aufgrund eines Defekts im Werkzeug oder in der Produktionslinie. Auch eine übermäßige Erwärmung beim Schleifen kann die Struktur der Siliziumwafer beschädigen.
Was auch immer passiert ist, es ist interessant, dass der fehlerhafte Wafer die Qualitätskontrolle bestanden hat. Da die Grafikkarte im Werk von PowerColor hergestellt wurde, liegt die Verantwortung letztlich bei PowerColor, aber der Fehler hätte auch schon früher auftreten können, entweder bei TSMC oder in anderen Zwischenbetrieben. Es ist auch möglich, dass das KI-basierte Qualitätskontrollsystem der Aufgabe nicht gewachsen war und eine fehlerhafte Karte durchgeschlüpft ist - hoffentlich nicht eine komplette Lieferung.
AMD sagt, dass es sich im Moment um einen Einzelfall und nicht um ein Massenproblem zu handeln scheint. Es bleibt zu hoffen, dass die Grafikkarte mit der fehlerhaften GPU ersetzt wird, entweder durch den Besitzer oder durch die Mitarbeiter von Igor's Lab, falls sie in der Zwischenzeit von ihrem ursprünglichen Besitzer erworben wurde.