Anfang dieses Jahres wurde der Markt für künstliche Intelligenz aufgerüttelt, als DeepSeek mit einem KI-Tool auf den Plan trat, das den Kreationen der US-Tech-Giganten in fast jeder Hinsicht überlegen war. Die Geschichte wiederholt sich ein wenig, aber dieses Mal gehen westliche Unternehmen vielleicht etwas routinierter vor.
Die Ankunft von DeepSeek hat den Markt aufgerüttelt und große Veränderungen ausgelöst, aber das, was alle befürchtet haben - dass sich das Kräfteverhältnis in wenigen Augenblicken verschieben würde - ist nicht eingetreten. Die jüngste Ankündigung von Moonshot AI könnte zu einer ähnlichen Situation führen. Kürzlich wurde ein Sprachmodell namens Kimi K2 vorgestellt, das sehr billig sein soll, viel kosteneffizienter als GPT-4, und ein Open-Source-Sprachmodell ist.
Der chinesische Chatbot Kimi ist bereits seit einiger Zeit in Betrieb und kein völlig unbekannter Akteur auf dem Markt, aber das neue K2-Modell hat sicherlich überrascht. Bekannt ist, dass er die Mixture-of-Experts-Architektur verwendet und über 1 Billion Parameter verfügt, von denen 32 Milliarden aktiv sind. Der Kimi K2 ist sehr stark in der Programmierung, aber er hat auch seine Schwächen, zum Beispiel ist der multimodale Betrieb noch in der Entwicklung, aber das Unternehmen hat mehrere Pläne für die Zukunft. Das Kontextfenster hat derzeit 128.000 Token.
Moonshot AI bietet zwei Versionen davon an, es gibt ein Basismodell, das sich direkt an Forscher und Entwickler richtet. Damit lassen sich neue Dienste erstellen, um Forschungsprojekte zu lösen. Die andere ist eine auf Anweisungen abgestimmte Version, die so optimiert ist, dass sie so effizient wie möglich im Kontext von Chatbots funktioniert. Darüber hinaus ist das letztgenannte Modell bereits eingerichtet, um Agenten mit künstlicher Intelligenz für die Partner von Moonshot AI zu erstellen, ein dynamisches Geschäft, in dem viele jetzt versuchen, sich einen Namen zu machen.
"Das Sprachmodell Kimi K2 reagiert nicht nur, es agiert. Mit Kimi K2 ist fortschrittliche Agentenintelligenz offener und zugänglicher als je zuvor." - heißt es in der Ankündigung des Unternehmens. Moonshot fügte hinzu, dass sie gespannt sind, wie das neue LLM-Tool von interessierten Parteien genutzt werden wird.
Das Startup betonte, dass das Modell in der Lage sein wird, unabhängig und mit hoher Effizienz zu arbeiten. Es schreibt Code, führt ihn aus, testet ihn und ist in der Lage, ihn zu ergänzen. Es kann komplexe Aufgaben in mehreren Schritten ohne menschliches Eingreifen durchführen. In einem Beispiel von Moonshot führt es 16 Python-Operationen aus, um eine statistische Analyse zu erstellen, für die es auch eine interaktive Visualisierung erstellt. In einem anderen Beispiel wird ein Konzert von der KI mit Hilfe von 17 verschiedenen Tools plattformübergreifend organisiert. Auch die Suchmaschine, der Kalender, der Mailer, der Flugplaner, der Unterkunftssucher und die Restaurantbuchungssoftware wurden eingesetzt.
Im LiveCodeBench war sie die einzige, die mit 53,7 % über 50 % lag. Das zweitplatzierte Modell Claude 4 Opus schaffte nur 47,4 %. Im GPQA Diamond liegt es mit 76,6 % nur in der zweiten Hälfte der Rangliste, während das neue Grok 4 mit 87,7 % an der Spitze liegt. Allerdings sind alle besseren Modelle teurer im Betrieb, was ebenfalls ein wichtiger Faktor ist, und es handelt sich um eine Open-Source-Basis, die in der Spitzengruppe nicht so verbreitet ist.
Laut Moonshot AI ist das Kimi K2-Modell aus der Sicht der Verarbeitung wirklich kosteneffizient und kostet nur 0,15 $ für die Verarbeitung von 1 Million Token. Bei den Ausgabeinhalten sieht es noch schlimmer aus: Sie kosten 2,5 Dollar pro 1 Million Token. Der Agent wird seine Aufgabe sehr gut erfüllen, denn er scheint in der Lage zu sein, viele Aufgaben wirklich effizient zu erledigen, und seine Kosten werden nicht sinken.