Kategorien

AMD-BASIERTES EL CAPITAN WIRD ZUM SCHNELLSTEN SUPERCOMPUTER-CLUSTER DER WELT - MIT EINER LEISTUNG VON 1,7 EXAFLOP/S

Das neue System wurde gründlich überarbeitet und ist nun offiziell das schnellste der Welt. Ob chinesische Supercomputer-Cluster diese Geschwindigkeit übertreffen können, bleibt ein Geheimnis, da keine Leistungsdaten verfügbar sind.
J.o.k.e.r
J.o.k.e.r
AMD-basiertes El Capitan wird zum schnellsten Supercomputer-Cluster der Welt - mit einer Leistung von 1,7 ExaFLOP/s

Die diesjährige zweite Ausgabe des renommierten globalen Supercomputer-Clusters TOP500.org wurde veröffentlicht und birgt eine interessante Überraschung, denn der erste Platz wurde entthront: der AMD-basierte El Capitan ist nun der schnellste Supercomputer-Cluster der Welt mit einer Rechenleistung von 1.742 ExaFLOP/s. Als die Liste im Juni veröffentlicht wurde, war der Frontier mit 1,3 ExaFLOP/s noch der Schnellste.

AMD und das Lawrence Livermore National Laboratory haben eng zusammengearbeitet, um einen neuen Supercomputer-Cluster mit einer beispiellosen Anzahl von 11.136 Knoten, bestehend aus 44.544 AMD MI300A APUs, zu schaffen, der mehr Rechenleistung als je zuvor bietet. Die MI300A APUs sind Ihnen vielleicht schon aus unseren früheren Nachrichten bekannt: Diese APUs enthalten insgesamt 13 Chipsätze, die insgesamt 24 ZEN 4-basierte Prozessorkerne bereitstellen, die unter den richtigen Bedingungen mit einer maximalen Boost-Taktfrequenz von 3,7 GHz laufen können.

Galerie öffnen

Das Gehäuse verbirgt auch eine CDNA 3-basierte GPU, die als KI-Beschleuniger fungiert und insgesamt 14592 Stream Units in 228 CU-Arrays zur Verfügung stellt. Die maximale GPU-Taktfrequenz beträgt in diesem Fall 2100 MHz, und die GPU hat auch Zugriff auf insgesamt acht HBM3-Speicherchip-Sandwiches, wodurch 128 GB Speicher über die 8192-Bit-Speicheradresse zur Verfügung stehen. Die maximale Speicherbandbreite beträgt 5,3 TB/s und ECC-Support ist natürlich auch vorhanden. Zusätzlich zu den CPU- und GPU-Kernen, die für eine enorme Rechenleistung sorgen, sind insgesamt 5,4 PB Systemspeicher enthalten, und ein Datenspeicher-Subsystem namens Rabbit ist in den Supercomputer-Cluster integriert. Der El Capitan basiert auf HPE Cray EX255a Racks, wobei das Slingshot 11 Netzwerk-Interconnect-System von Cray die Bandbreite für die Kommunikation bereitstellt.

Galerie öffnen

Der El Capitan bietet eine 45 %ige Steigerung der theoretischen maximalen Rechenleistung gegenüber dem zweitplatzierten Frontier. Die Durchführung von 1,742 Billionen Operationen ist im Wesentlichen so, als würde man 54 Milliarden Jahre lang jede Sekunde eine Operation durchführen, mit dem Unterschied, dass El Capitan dies jede Sekunde tun kann.

Was wird El Capitan tun? In erster Linie soll er (auch) zur Modernisierung des Nuklearwaffenarsenals des US-Militärs eingesetzt werden, und zwar von NNSA-Spezialisten, die dank seiner enormen Rechenleistung Nuklearexplosionen simulieren können, ohne unterirdisch detonieren zu müssen. Sie werden den schnellsten Supercomputer-Cluster der Welt auch für andere Zwecke nutzen können, um Aufgaben in der KI- und HPC-Branche effizient zu erledigen. El Capitan arbeitet bei Volllast mit etwas weniger als 30 Megawatt und bietet eine Rechenleistung von 58,89 GigaFLOP/s pro Watt. Damit steht er auf Platz 18 der Green500-Liste der umweltfreundlichsten Supercomputer-Cluster.

Galerie öffnen

Frontier ist mit einer Rechenleistung von nur 1.353 ExaFLOP/s vom ersten auf den zweiten Platz abgerutscht. Dieses System basiert auf der HPE Cray EX235a mit AMDs 64-Core-EPYC-Serverprozessoren der dritten Generation in den Racks, zusammen mit MI250X-Beschleunigern für den KI- und HPC-Markt. Das System verfügt über insgesamt 9 066 176 Kerne, eine Erweiterung gegenüber der vorherigen Architektur, die in der Liste aufgeführt ist und nur 8 699 904 Kerne aufwies. Dieses System nutzt auch das Slingshot-11-Verbindungssystem von Cray und verbraucht 24.607 Megawatt.

Galerie öffnen

Die Aurora ist auf den dritten Platz zurückgefallen, mit einer Rechenleistung von 1.012 ExaFLOP/s dank Xeon Max 9470 Prozessoren mit je 52 Kernen und Intel Data Center GPU Max Series AI Beschleunigern in den Racks. Dieses System verfügt über 9.264 Kerne mit 128 Kernen und einer Leistungsaufnahme von 38.698 Megawatt. Die Situation ist interessant, weil die Rechenleistung im Vergleich zur letzten Messung nicht aktualisiert wurde, obwohl zu diesem Zeitpunkt nur 87 % des Gesamtsystems in Betrieb waren.

Damals gab das Intel-Team zu, dass es Probleme mit der Hardware und der Kühlung gab, die zu Fehlern im Betrieb und instabiler Netzwerkkommunikation führten. Es scheint, dass die Fehler seither nicht vollständig behoben wurden, was wahrscheinlich der Grund dafür ist, dass keine neuen Ergebnisse veröffentlicht wurden. Trotzdem führt Aurora immer noch den KI-zentrierten HPL-MxP-Mixed-Precision-Test an, d. h. es ist der schnellste KI-Supercomputer-Cluster mit einer Rechenleistung von 10,6 AI ExaFLOP/s.

Galerie öffnen

Auch im Rest der Liste haben sich einige Änderungen ergeben. Die japanische Fugaku ist von Platz 4 im Juni auf Platz 6 vorgerückt, während Eagle, zuvor auf Platz 3, auf Platz 4 zurückgefallen ist. Auf dem fünften Platz liegt ein Neueinsteiger, der italienische HPC6, während der sechste Platz an die bereits erwähnte japanische Fugaku geht. Der Swiss Alps ist vom sechsten auf den siebten Platz vorgerückt, aber mit 2 121 600 statt 1 305 600 Rechenkernen an Bord ist seine Rechenleistung von 270 PetaFLOP/s auf 434,9 PetaFLOP/s gestiegen.

Achter wurde diesmal der finnische LUMI, der zuvor Fünfter war - weder an der Leistung noch an der Architektur dieses Clusters hat sich etwas geändert. An neunter Stelle liegt der italienische Leonardo, der vom siebten Platz zurückgefallen ist, wobei sich weder die Hardware noch die Rechenleistung geändert haben und der Wert bei 241,2 PetaFLOP/s liegt.

Auf dem 10. Platz befindet sich diesmal ein neues System, das US-amerikanische Tuolumne, das wie das erstplatzierte El Capitan auf AMD MI300A APUs basiert, aber mit nur 1 161 216 verfügbaren Kernen eine Rechenleistung von nur 208,1 PetaFLOP/s aufweist. Interessanterweise hatte der 10. Platz im Juni nur 121,4 PetaFLOP/s, aber das ist nicht mehr genug, um in die Top 10 zu kommen, und der US EOS Nvidia DGX SuperPod ist auf Platz 12 zurückgefallen.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang