Aufgrund des KI-Fiebers hat nicht nur das Segment der Speicherchips in letzter Zeit enorme Preissteigerungen erfahren, sondern auch das Segment der Festplatten, insbesondere die Modelle mit hoher Speicherkapazität, die hauptsächlich für Archivierungszwecke konzipiert sind.
Die Preise für diese Produkte haben sich im Vergleich zum Sommer letzten Jahres verdreifacht, was nicht nur Durchschnittsnutzer, kleine Unternehmen und Betreiber von Rechenzentren in eine schwierige Lage bringt, sondern auch Organisationen, die täglich versuchen, Internetinhalte zu archivieren. Diese Aufgabe ist auch deshalb wichtig, weil sie es ermöglicht, wiederzufinden, wie jede Website in der Vergangenheit aussah, und außerdem, so die Autoren, bietet sie einen universellen Zugang zu allem Wissen.
Eine schwierige Situation für einzelne Organisationen und Stiftungen
Laut 404 Media ist es für diese Organisationen schwierig, angesichts der drastisch gestiegenen Kosten für Festplattenspeicherplatz für die Archivierung zu arbeiten. So müssen die Server des Internet Archive täglich 100 TB neue Daten speichern, um z. B. die Funktion Waybak Machine bereitzustellen, was im KI-Fieber eine enorme Belastung darstellt. Für eine Organisation mit etwa 210 PB oder etwa 210 000 TB gespeicherten Inhalten ist es ein ziemliches Problem, Backups zu erstellen, da dies nicht nur viel Zeit, sondern auch viel Geld erfordert.
Die für diese Aufgabe am besten geeigneten 28-30-TB-Festplatten sind Mangelware, und wo sie verfügbar sind, sind sie in der Regel sehr teuer. In der Zwischenzeit versuchen sie, Speicher von den großen Festplattenherstellern zu beziehen, aber da die Unternehmen mit der Erfüllung großer Aufträge beschäftigt sind, ist es schwierig, ähnliche Organisationen zu bedienen.
Die Muttergesellschaft von WikiPedia, die Wikimedia Foundation, hat es nicht leichter: Sie muss mehr als 65 Millionen Artikel speichern und verwalten, was bereits eine sorgfältige Budgetplanung erfordert, und die derzeitige ungünstige Situation kommt noch hinzu. Die Stiftung sieht sich auch mit Schwierigkeiten bei der Beschaffung von Speicher und Festplatten sowie mit den langen Vorlaufzeiten für die Bestellung von Servern durch Unternehmen konfrontiert. Eine weitere Herausforderung ist die Sicherstellung ausreichender Kapazitäten für die notwendigen Anschaffungen, was die Grundfinanzierung betrifft.
Die Schwierigkeiten betreffen auch spezielle Datensicherungsinitiativen wie das End of Term Archive, das versucht, den Inhalt von Regierungswebsites zu sichern, die unter verschiedenen Verwaltungen verfügbar sind. Man hofft, dass sich die Situation bis zur nächsten großen Datensicherung etwas verbessert hat, was die Hardwarepreise betrifft.
Es wird immer schwieriger, Inhalte zu sichern, was auch auf das KI-Fieber zurückzuführen ist
Funktionen wie die Wayback Machine funktionieren nur dann, wenn sie in der Lage sind, die Daten aus den verschiedenen Websites zu extrahieren, die unbedingt erforderlich sind, um ein vollständiges Backup mit ausreichender Effizienz zu erstellen. Dies ist nicht mehr so einfach wie noch vor einigen Jahren, da die Betreiber solche Versuche der Datenextraktion zunehmend blockieren, da die Unternehmen auch verschiedene Algorithmen zur Datenextraktion für das Training verschiedener KI-Modelle verwenden, oft auf nicht ganz legale Weise, und sich durch verschiedene Beschränkungen davor zu schützen versuchen. Die Schutzmechanismen halten auch Bots für Bildungs- und Archivierungszwecke fern, was die Erstellung von Backups erschwert.
Da Festplatten immer teurer werden, befinden sich auch die Mitwirkenden, die zur Bewahrung von Inhalten beitragen, in einer schwierigen Lage, da sie nun zweimal darüber nachdenken müssen, was sich zu retten lohnt und was nicht, da auch sie es sich nicht leisten können, genügend Platz zu sparen.