Von Zeit zu Zeit tauchen große Sprachmodelle auf, , sowie Tools der künstlichen Intelligenz und in China, die es mit westlichen Entwicklungen aufnehmen können. Zwar konnte bisher noch keines dieser Tools das Kräfteverhältnis grundlegend verändern, doch es lohnt sich auf jeden Fall, sie im Auge zu behalten. Gerade jetzt hat Zhipu AI, kurz Z.ai, ein leistungsstarkes Modell namens GLM-5.2 vorgestellt.
Die neueste Version des offenen GLM-Modells kann 753 Milliarden Parameter nutzen, wobei natürlich nur ein Bruchteil davon gleichzeitig aktiv ist, wodurch es eine hervorragende Effizienz bietet. Bisherigen Analysen zufolge schneidet es bei besonders komplexen, „langfristigen“ Herausforderungen im Bereich der autonomen Programmierung sowie im Bereich der Cybersicherheit besonders gut ab und erzielt hier die besten Ergebnisse.
Mit GLM-5.2 führt Z.ai sein bedeutendes Architekturoptimierungsverfahren namens „IndexShare“ ein. Bei herkömmlichen großen Sprachmodellen erfordert die Neuberechnung der Aufmerksamkeitsmechanismen während des Betriebs extrem hohe Rechenkapazitäten und stellt bei umfangreichen Dokumenten und langen Kontexten eine erhebliche Belastung dar. Hier setzt IndexShare neue Maßstäbe, indem es in jeder vierten Aufmerksamkeitsschicht denselben Indexer im Rotationsverfahren verwendet.
Das Modell arbeitet mit einem Kontextfenster von 1 Million Token, und das Entwicklerteam hob hervor, dass IndexShare bei einer derart großen Datenmenge pro Token fast ein Drittel weniger Rechenleistung benötigt als die – nicht namentlich genannte – Konkurrenz. Aber auch zahlreiche andere Technologien werden eingesetzt, um die Effizienz zu steigern. Das GLM-5.2 ist gut skalierbar und unterscheidet mehrere Argumentationsebenen, sodass es stets mit der idealen Geschwindigkeit und Genauigkeit arbeiten kann.
Im Rahmen des beliebten SWE-Bench Pro erreicht das GLM-5.2 bereits 62,1 Prozent, während das Gemini 3.1 Pro 54,2 % und das GPT-5.5 58,6 % erzielen, bleibt jedoch hinter den 69,2 % des Opus 4.8 zurück, sodass Claude in diesem Bereich zwar einen Schritt voraus ist, dafür aber auch deutlich teurer ist. Im ebenfalls beliebten „Humanity’s Last Exam“-Test erreicht es ohne Zusatzmodule zwar nur 40,5 % und bleibt damit hinter seinen Konkurrenten zurück, doch mit Einsatz von Tools glänzt es bereits mit 54,7 % und liegt damit vor Gemini und GPT, landete aber erneut hinter Opus.
Ein im Wall Street Journal veröffentlichter Bericht wies darauf hin, dass sich die neueste Entwicklung von Z.ai bei Cybersicherheitsaufgaben als erstaunlich stark erweist, was von Experten teilweise durchaus als besorgniserregend angesehen wird. Denn dieses Modell ist nicht so „gut reguliert“ verfügbar wie die vom Anthropic-Team entwickelten Modelle Mythos und Fable. Laut Sicherheitsforschern deckt das GLM-5.2 Schwachstellen und Anfälligkeiten effektiv auf.
Derzeit liegen die Modelle aus Fernost noch nicht allgemein an der Spitze, aber „China sorgt dafür, dass dieser Unterschied mit der Zeit immer kleiner wird“, sagte Lior Div, Geschäftsführer des Cybersicherheitsunternehmens 7AI.
Wie die meisten chinesischen Modelle lässt sich auch das GLM-5.2 recht kostengünstig betreiben, da es vergleichsweise geringe Rechenkapazitäten benötigt. Für chinesische Unternehmen ist dies von entscheidender Bedeutung, da sie im Vergleich zu ihren westlichen Konkurrenten nur schwer Zugang zu großer Rechenkapazität haben.
Die Verarbeitung von einer Million Token kostet hier lediglich 1,4 Dollar, und die Erstellung von einer Million Token ist bereits für 4,4 Dollar möglich. Das leichtgewichtige 3.5-Flash-Modell von Gemini ist zwar bei der Verarbeitung nicht viel teurer – es kostet 1,5 Dollar für 1 Million Token –, doch auf der Ausgabeseite kostet dieses Unterfangen bereits 9 Dollar. Im Falle des oben erwähnten Mythos kostet bereits die Verarbeitung von 1 Million Token 10 Dollar, während die Generierung bei dieser Menge 50 Dollar kostet.