Kategorien

NVIDIA UND KIOXIA BÜNDELN IHRE KRÄFTE: 100 MILLIONEN IOPS SSDS FÜR DEN KI-MARKT BIS 2027

Der neue SSD-Typ könnte eine enorme Beschleunigung an der KI-Front bringen.
J.o.k.e.r
J.o.k.e.r
Nvidia und Kioxia bündeln ihre Kräfte: 100 Millionen IOPS SSDs für den KI-Markt bis 2027

Dank der Zusammenarbeit zwischen Kioxia und Nvidia werden die ersten SSDs mit einer Leistung von bis zu 100 Millionen IOPS bis zum Jahr 2027 verfügbar sein, was eine erhebliche Verbesserung gegenüber dem derzeitigen Leistungsniveau darstellt und insbesondere dem KI-Segment zugute kommen wird.

Die Zusammenarbeit wurde von offiziellen Vertretern von Kioxia angekündigt, die hinzufügten, dass die Entwicklungsarbeit in Kürze beginnen wird, abhängig von den Zielen und Erwartungen des Nvidia-Teams an die Fähigkeiten des Endprodukts. Den Angaben zufolge erwartet Nvidia den Einsatz von zwei dieser SSDs, die direkt an die Grafikprozessoren der KI-Beschleuniger angeschlossen werden können und zusammen eine Leistung von 200 Millionen IOPS bieten, wodurch der direkte Zugriff auf KI-bezogene Daten erheblich beschleunigt wird.

Galerie öffnen

Es wird erwartet, dass die neuen SSDs PCI Express 7.0-Konnektivität nutzen und direkt mit den GPUs auf P2P-Basis (Peer-to-Peer) verbunden werden. Sie zielen eindeutig auf das Segment der KI-Beschleuniger ab, in dem die Notwendigkeit eines schnellen und effizienten Zugriffs auf die Daten, die für die Beschleunigung verschiedener Prozesse erforderlich sind, von größter Bedeutung ist.

Interessanterweise sucht Nvidia, wie Wallace Kou von Silicon Motion bereits erwähnte, nach einer SSD, die eine zufällige Leseleistung von 100 Millionen IOPS bietet, was eine 33-fache Verbesserung gegenüber aktuellen SSDs darstellt. Aktuelle SSD-Laufwerke bieten eine Leistung von etwa 3 Millionen IOPS für zufällige 4K-Lese- oder Schreibaufgaben, was einfach nicht ausreicht, um die Ziele von Nvidia zu erreichen, sodass neue Laufwerke, die in diesem Bereich um Größenordnungen schneller sind, definitiv benötigt werden.

Da erwartet wird, dass die KI-Workflows hauptsächlich mit kleinen, aber sehr häufigen zufälligen Leseaufgaben beim Zugriff auf verschiedene Daten ablaufen werden, müssen die künftigen SSDs auch für diese Art von Belastung optimiert werden. Dementsprechend sollten 512-Byte-Blöcke anstelle von 4 KB verwendet werden, was sich zwar auf die Rohbandbreite auswirken kann, aber die Skalierung der Lese- und Schreibgeschwindigkeiten durch die Verwendung von mehr Laufwerken in einem bestimmten Speichersystem erleichtert.

Galerie öffnen

Der XL-Flash von Kioxia, bei dem es sich im Wesentlichen um einen hochbeständigen SLC-NAND-Speicher mit sehr geringer Latenz und relativ hoher Geschwindigkeit handelt, könnte die richtige Wahl sein. Diese XL-Flash-Chips arbeiten in 16 Ebenen, während moderne 3D-NAND-Flash-Chips in der Regel nur in 3-6 Ebenen arbeiten, was bedeutet, dass XL-Flash im Vergleich zu diesen eine höhere maximale Datenübertragungsbandbreite sowie eine schnellere Leistung für zufällige Lese- und Schreibaufgaben bieten kann. Da sich dieser Speichertyp noch in der Entwicklung befindet und Kioxia noch keine spezifischen Spezifikationen veröffentlicht hat, gibt es keinen Hinweis darauf, was wir in Bezug auf die Geschwindigkeiten erwarten können.

Basierend auf der Tatsache, dass eine Innogrit Tacoma 400GB XL-Flash SSD, die aus 32 NAND-Chips besteht, von denen 7 Over-Provisioning unterstützen, 3,5 Millionen IOPS zufälliges Lesen und 0,5 Millionen IOPS zufälliges Schreiben über eine PCI Express 5.0 x4 Schnittstelle erreichen kann, können wir jedoch erwarten, dass wir ungefähr 110.000 IOPS zufällige Lese- und 15.600 IOPS zufällige Schreibleistung von einer dieser Karten sehen. Wenn die Skalierung nahezu linear ist, kann die 512B-Zufallsleserate von 100 Millionen IOPS mit 915 solcher Karten erreicht werden, wenn das gleiche Maß an Over-Provisioning angewendet wird.

Dies wäre eine riesige Anzahl von Wafern, aber Kioxia ist bereits in der Lage, bis zu 32 Speicherwafer auf einem einzigen Chip zu stapeln, so dass die Zahl viel freundlicher ist: 28 Chips können bereits die erforderlichen 915 Speicherwafer aufnehmen. Für den Betrieb eines solchen Laufwerks sind möglicherweise PCI Express 5.0 x16- oder PCI Express 7.0 x4-Schnittstellen erforderlich, die derzeit verfügbar sind, aber in Wirklichkeit ist die Skalierung nicht so linear, da die tatsächliche Geschwindigkeit von vielen Faktoren beeinflusst wird. Die beste Chance, eine solche SSD effizient zu bauen, bestünde darin, Dutzende von Controllern und einen Switch zu verwenden, um einen Großteil der Schwierigkeiten zu beseitigen, was keine leichte Aufgabe ist und das Endergebnis in Frage stellt.

Galerie öffnen

Eine andere Möglichkeit wäre die Verwendung der HBF-Technologie (High Bandwidth Flash), bei der ein Chip bis zu 16 NAND-Flash-Chips mit einem darunter liegenden Logikchip, der ein Controller sein könnte, enthalten könnte. Diese Chips können die NAND-Flash-Zellen in Arrays nutzen und so eine sehr hohe parallele Leistung und eine hohe Datenbandbreite erreichen.

Es ist noch nicht klar, welchen Weg das Kioxia-Team einschlagen wird, aber es ist wahrscheinlich, dass die Erfahrungen aus den HBF-Speicherexperimenten in die Entwicklung der neuen Hochleistungs-SSD-Architektur einfließen werden. Es ist zu hoffen, dass in nicht allzu ferner Zukunft konkrete Einzelheiten über das Projekt bekannt gegeben werden.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang