Ab 2022 wird die künstliche Intelligenz in ihren verschiedenen Formen eine immer wichtigere Rolle im Technologiesektor spielen. In den letzten Jahren haben wir gesehen, dass US-amerikanische Unternehmen diesen Markt dominiert haben, aber jetzt ist fast aus dem Nichts ein chinesischer Akteur mit Versprechungen aufgetaucht, die niemand erwartet hat.
Der DeepSeek R1 soll genauso effizient sein wie das o1-Modell von OpenAI und dabei nur einen Bruchteil des Preises für den Betrieb kosten. Vor allem aus dem letztgenannten Grund hat es in der Tech-Branche angesichts der jüngsten Entwicklungen eine kleine Panik gegeben.
Am 20. Januar veröffentlichte das chinesische Startup DeepSeek sein R1-Modell. Nach Angaben seiner Entwickler ist es darauf ausgelegt, komplexe Probleme zu lösen und Antworten auf mehrere komplexe Fragen mit hoher Genauigkeit zu geben. Unter dem Dach von OpenAI dient das im September angekündigte o1-Modell einem ähnlichen Zweck. Die Möglichkeiten gehen hier weit über das hinaus, was die ersten Chatbots 1-1,5 Jahre zuvor leisten konnten.
Was die Entwicklung von DeepSeek betrifft, so ist allein die Tatsache, dass es mit dem von OpenAI entwickelten o1-Modell konkurrieren kann, eine große Sache, aber das allein wäre noch kein Grund, großes Aufsehen zu erregen. Was die westliche Welt wirklich beunruhigt, ist die Tatsache, dass DeepSeek in der Lage war, seine eigene Lösung unglaublich billig zu entwickeln. Mit den Fortschritten der KI haben wir uns auch daran gewöhnt, dass buchstäblich Dutzende und Hunderte von Milliarden von Dollar in verschiedene Investitionen fließen. Aber nicht hier.
Das schlussfolgernde Modell R1 basiert auf dem großen Sprachmodell V3 LLM, das das Unternehmen im Dezember vorstellte. Es wurde Berichten zufolge mit einem Budget von rund 5,6 Millionen Dollar entwickelt. Es ist wirklich keine Übertreibung zu sagen, dass DeepSeek R1 und OpenAI R1, oder auch nur GPT-4o, mit unvergleichlichen Budgets arbeiten.
Eine Gemeinsamkeit zwischen DeepSeek und den führenden Technologieunternehmen besteht darin, dass sie beide Nvidia-Chips verwenden. Nvidia ist allgegenwärtig, selbst wenn eine neue "Wunder-KI" auf den Plan tritt. Aber auch an dieser Front ist das Interesse groß. Nach den vorliegenden Informationen wurden nur etwa 2000 Nvidia-Beschleuniger benötigt, um das V3 LLM-System zu trainieren, während die großen Technologieunternehmen in einigen Fällen die zehnfache Anzahl verwenden.
Sehr interessant ist auch, dass DeepSeek für seine Arbeit sogar mit Sanktionen rechnen musste. In China ist es nicht mehr einfach, Zugang zu Nvidia-Beschleunigerkarten zu erhalten. Beim Training waren H800-Beschleuniger im Einsatz, und den Angaben zufolge wurden mit diesen Prozessoren insgesamt fast 2,67 Millionen Arbeitsstunden für das Training aufgewendet. Das R1-Sprachmodell arbeitet mit 128.000 Token-Kontextfenstern.
Berichten zufolge ist DeepSeek R1 in Bezug auf das logische Denken viel besser als die früheren, traditionelleren Modelle, aber die neueste Version von OpenAI o1 ist bereits etwas besser, wobei die o1-Preview-Version keine eindeutigen Ergebnisse liefert. An der mathematischen Front ist die Situation ähnlich, R1 ist unglaublich stark, aber je nach Messung ist o1 im Allgemeinen noch besser. Beim Programmieren kann er mit dem o1 konkurrieren, aber beim einfachen Schreiben schneidet der R1 besser ab, teilweise weil er weniger "zensiert" ist und freier agieren kann. Unten sehen Sie einige Testergebnisse.
Das wirklich Tolle am R1 ist, dass er wirklich unglaublich günstig ist. Nur winzige Modelle, die einfach lokal, sogar auf einem Mobiltelefon, ausgeführt werden können, sind billiger als er, wie der GPT-4o-mini oder der Claude 3 Haiku, während er nicht in der gleichen Liga wie diese spielt, sondern der Claude 3.5 Sonnet und der o1. Die Verarbeitung von 1 Million Token für den o1 kostet laut OpenAIs Preisliste $15, während das R1-Rechenmodell $0,55 kostet. In der Ausgabe kostet 1 Million Token für o1 jetzt $60, während es für R1 $2,19 kostet.
Es wird sehr interessant sein zu sehen, wie sich die Zukunft des DeepSeek R1 entwickelt. Es wird derzeit unglaublich gehypt, das Unternehmen muss jetzt die Registrierungen regional beschränken, es hat Berichten zufolge einen großen Cyberangriff erhalten und wird zudem mit Anfragen überschwemmt. Sein Chatbot ist inzwischen die beliebteste App im App Store und hat ChatGPT überholt.