AMD hat vor einigen Tagen bekannt gegeben, dass das Unternehmen ein vielversprechendes Start-up übernehmen wird, das inmitten des KI-Booms und der Speicherkrise sehr nützlich sein wird, denn es hilft dabei, den verfügbaren Systemspeicher in KI-Rechenzentren effizienter zu nutzen, wodurch die Gesamtbetriebskosten sinken und die Grenzen, die zuvor durch die DRAM-Kapazität gesetzt waren, verschoben werden.
MEXT hat im Wesentlichen einen KI-basierten Algorithmus zur Optimierung der Speichernutzung entwickelt, dessen Aufgabe es ist, die Daten für das jeweilige System effizient nutzbar zu machen, sodass nur jene Inhalte im Speicher vorhanden sind, die voraussichtlich tatsächlich benötigt werden, während die übrigen Daten, die im aktuellen Zyklus des laufenden Arbeitsprozesses voraussichtlich nicht benötigt werden, vom Algorithmus verschoben werden. Welche Daten der Server, auf dem gerade ein KI-Modell oder eine andere Aufgabe ausgeführt wird, tatsächlich benötigt, versucht die von MEXT entwickelte Predictive Memory Engine zu ermitteln, indem sie kontinuierlich die Speicherzugriffsmuster lernt und auf dieser Grundlage diejenigen Inhalte verschiebt, die wahrscheinlich nicht benötigt werden.
Wohin wandern diese Inhalte? Da Speicherkapazität wertvoll und zudem extrem teuer ist und im Verhältnis zum Bedarf nur begrenzt zur Verfügung steht, haben die Entwickler des Start-ups eine Lösung gefunden: Mit Hilfe der KI werden die gerade nicht benötigten Daten auf den NAND-Flash-Speicher ausgelagert, sodass an ihrer Stelle Inhalte untergebracht werden können, die tatsächlich benötigt werden. Dies ist ein wichtiger Schritt, da in der heutigen modernen KI-Infrastruktur die Speicherkapazität in der Regel recht verschwenderisch genutzt wird, weshalb die Möglichkeiten in der Regel nicht durch die CPU- oder GPU-Ressourcen begrenzt werden, sondern durch die Speichergrenzen – was angesichts der aktuellen Speicherkrise noch schmerzhafter ist als zuvor.
Der prädiktive Algorithmus ist in der Lage, mithilfe von KI-Modellen jene Daten rechtzeitig in den Arbeitsspeicher zu kopieren, die in Kürze benötigt werden, sodass die Software sofort darauf zugreifen kann, als befänden sie sich von vornherein im Arbeitsspeicher. Natürlich kann die gerade ausgeführte Anwendung auch auf die Daten zugreifen, die auf den NAND-Flash-Speicher ausgelagert wurden, da die Predictive Memory Engine transparent arbeitet: Der zur Entlastung des DRAM reservierte NAND-Flash-Speicher erscheint für die Software so, als wäre er Teil des Systemspeichers.
AMD plant, die Technologie in seinem eigenen Rechenzentrumsportfolio einzusetzen und weiterzuentwickeln, um mit den ständig wachsenden Datensätzen der KI-Modelle Schritt halten zu können, gleichzeitig die Betriebskosten zu senken und große Datensätze schneller nutzbar zu machen. Insgesamt verbessert die Innovation die Effizienz der Ressourcenauslastung des Systems, insbesondere im Hinblick auf die Speichernutzung. Eine optimale Speicherverwaltung kann auch die Gesamtleistung des Systems steigern, jedoch hängt das genaue Ausmaß davon ab, wie die jeweilige Infrastruktur aufgebaut ist, wie komplex die aktuell ausgeführten Aufgaben sind und wie gut die KI-Modelle „vorhersagen“ können, welche Daten im nächsten Arbeitsschritt benötigt werden.
Diese spezielle Technologie trägt dazu bei, das Produktportfolio von AMD wettbewerbsfähiger zu machen und die Leistung von KI-Rechenzentren zu optimieren, sodass sowohl der Hersteller als auch seine Partner davon profitieren – zumindest ist dies das Ziel.