Kategorien

GROK 4 STARTET MIT EINEM 300-DOLLAR-ABONNEMENTPAKET

Die neueste Version des Grok-Sprachmodells ist erstaunlich leistungsfähig und übertrifft in den meisten Fällen seine Konkurrenten.
DemonDani
DemonDani
Grok 4 startet mit einem 300-Dollar-Abonnementpaket

Im Jahr 2023 gründete Elon Musk xAI, das Unternehmen, das das Grok-Sprachmodell entwickelt, und hat nun ein Sprachmodell entwickelt, das wirklich Spitzenleistungen erbringen kann. Nicht nur xAI äußert sich sehr positiv über die Ergebnisse des neuen LLM-Tools, auch unabhängige Analysten sind zu dem Schluss gekommen, dass Grok 4 tatsächlich ein vorbildliches Produkt ist.

Während der Demonstration sprach Elon Musk darüber, dass die generative künstliche Intelligenz auf der Grundlage des neuen Sprachmodells bereits intelligenter ist als alle Studenten aller akademischen Disziplinen. Das ist eine starke Aussage, aber wir haben uns an die starke Sprache des Geschäftsmannes gewöhnt. Er sagte auch, dass er glaubt, dass Grok bereits stark genug ist, um wissenschaftliche Entdeckungen zu machen.

"Manchmal fehlt es ihm vielleicht an gesundem Menschenverstand und er hat noch keine neuen Technologien erfunden oder neue Physik entdeckt, aber das ist nur eine Frage der Zeit." - sagte Musk und deutete damit subtil an, dass es in den letzten Tagen viele Probleme mit dem Chatbot gegeben hat. Der Dienst hat xAI unerwartete Arbeit beschert, indem er eine antisemitische "Persona" annahm, was ihn dazu zwang, viele seiner Äußerungen anschließend zu löschen.

Galerie öffnen

Die neue Generation von Grok wird in zwei Versionen erhältlich sein: die Basisversion Grok 4 und die rechenintensivere, mehrparametrige Grok 4 Heavy. xAI bezeichnet letztere nun als eine Version, die als mehrere KI-Agenten agieren kann. Das klingt sehr interessant, in der Praxis soll Grok 4 Heavy in der Lage sein, mehrere generative KI-Agenten parallel an einer bestimmten Aufgabe arbeiten zu lassen und dann die Ergebnisse aller Agenten zu kombinieren. Es ist wie eine Task Force, die gemeinsam an einem Problem arbeitet, um die besten Antworten zu finden.

Heute gibt es unzählige KI-Tests, um Modelle zu messen und zu bewerten. Einer der anspruchsvollsten ist "Humanity's Last Exam", bei dem Chatbots mehr als 2.500 Fragen in Textform beantworten müssen. Die meisten Sprachmodelle erreichen eine Genauigkeit von weniger als 10 %, eine Handvoll Optionen liegt zwischen 10 und 15 %, und nur die besten erreichen 20 %. Der offizielle Spitzenreiter ist Gemini 2.5 Pro mit 21,6 %, gefolgt von o3 (OpenAI) mit 20,3 %.

Im Vergleich dazu erreicht Grok 4 jetzt eine Genauigkeit von 25,4 %. Das sieht für den Namen der Neuheit wirklich gut aus, obwohl hinzugefügt werden sollte, dass OpenAI mit dem Deep Research-Tool bereits 26,6 % erreicht hat.

Galerie öffnen

xAI betreibt bereits ein Datenzentrum mit 200.000 GPUs , um Grok zu entwickeln und zu betreiben. Zuletzt wurde berichtet, dass der Standort Colossus (Memphis Supercluster) immer schwieriger zu betreiben ist, da die Rechenkapazität immer weiter erhöht wird. Das ultimative Ziel von Elon Musk wäre es, eine Armee von einer Million "GPUs" in einem riesigen Rechenzentrum einzusetzen.

Die ersten unabhängigen Analysen haben auch bestätigt, dass es sich um ein sehr leistungsfähiges Gerät handelt. Artificial Analysis, ein Spezialist für das Testen von KI-Modellen, hat Grok in seinem eigenen komplexen Test so gut wie nie zuvor bewertet. Mit einer Punktzahl von 73 nach Durchlaufen der gesamten Testreihe lag das von OpenAI entwickelte o3-pro-Modell mit 71 Punkten an der Spitze des Rankings, und das Feld war sehr eng. Dahinter folgt der Gemini 2.5 Pro mit 70 Punkten, und der DeepSeek R1, der gerade vom Podium gerutscht ist, kommt auf 68 Punkte. Das Claude 4 Opus hat nur 64 Punkte, aber das Meta ist mit 51 Punkten zusammen mit dem Llama 4 in einer wirklich schlechten Position.

Galerie öffnen

In einem unabhängigen Test der gemeinnützigen Organisation ARC Prize erreichte das Grok 4 ein ganz neues Niveau. In dem äußerst anspruchsvollen ARC-AGI v2 Test war das Modell Claude 4 Opus das beste der verfügbaren Lösungen und erreichte eine Leistung von nur etwa 8 %. Bis jetzt sind alle Modelle unter 10 % geblieben, wobei Grok 4 15,9 % erreichte und damit eine Grenze durchbrach, die noch kein Sprachmodell zuvor erreicht hatte.

Galerie öffnen

Bei der Vorstellung von Grok 4 gab es nur wenige technische Details, aber es wurde jetzt bekannt, dass das Sprachmodell 256.000 Kontextfenster verwendet, was auf dem heutigen Gebiet nicht außergewöhnlich ist, ihm aber mehr Flexibilität verleiht als früheren Frameworks. Es kann sowohl Text als auch Bilder verarbeiten, aber das Entwicklungsteam muss noch an seinen multimodalen Fähigkeiten arbeiten. Im Moment ist Grok 4 (grok-4-07-09) relativ teuer: 3-6 Dollar für die Verarbeitung von 1 Million Token und 15-30 Dollar für die Generierung der gleichen Menge an Informationen.

Dies ist einer der Gründe, warum xAI künstliche Intelligenz nicht billig messen kann. Um einfach nur auf Grok 4 zuzugreifen, müssen Sie 30 Dollar pro Monat bezahlen, was in diesem Bereich nicht besonders hoch ist, da die meisten Chatbots Standardtarife von 20-30 Dollar haben. Das Fantasiepaket SuperGrok Heavy für 300 Dollar klingt jedoch ziemlich happig. SuperGrok Heavy-Abonnenten werden die ersten sein, die das Grok 4 Heavy-Modell nutzen können, und die ersten, die neue und experimentelle Funktionen testen können, die in Zukunft eingeführt werden.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang