Das Unternehmen hat im vergangenen Monat das erste Modell GPT-5.3 auf den Markt gebracht, und das Modell GPT-5.3 Instant wurde gerade erst eingeführt. Daher kam es etwas überraschend, als plötzlich das GPT-5.4 vorgestellt wurde.
OpenAI weiß genau, dass es einen großen Wurf machen muss, denn der Boden unter seinen Füßen ist in letzter Zeit ziemlich heiß geworden. Man denke nur an den rasanten Aufstieg von Google und die Tatsache, dass viele Menschen die Plattform aufgrund ihrer Vereinbarung mit dem US-Verteidigungsministerium kritisieren und boykottieren.
Wie üblich hat das Unternehmen das GPT-5.4 als sein bisher leistungsfähigstes und effektivstes Modell angepriesen. Es empfiehlt es nun speziell für die professionelle Arbeit. Für Benutzer, die maximale Leistung wünschen, stellt OpenAI das Modell GPT-5.4 Pro in ChatGPT und über die API zur Verfügung. Es ist speziell für komplexe Aufgaben optimiert, heißt es in der Ankündigung.
Als Tool der nächsten Generation wird GPT-5.4 den Vorgängermodellen in Bezug auf reasoning Fähigkeiten, Agenten-Workflow-Auflösung und Programmierung überlegen sein. Das Unternehmen hob insbesondere hervor, dass die Fähigkeiten des GPT-5.3 Codex-Modells, das weniger als einen Monat alt ist, in das neue Modell integriert wurden, um die beste Effizienz in einer Vielzahl von Softwareumgebungen für professionelle Aufgaben zu erreichen. Das neue Modell ist in der Lage, Tabellenkalkulationen, Präsentationen und Dokumente mit Bravour zu bewältigen und wird so zu einem wirklich schnellen, genauen und zuverlässigen Arbeitstier.
Nach Angaben von OpenAI wird GPT-5.4 Thinking mit vorgefertigten Denkschemata arbeiten und es den Benutzern ermöglichen, den "Gedankengang" spontan zu unterbrechen. Wenn sie sehen, dass eine Antwort von ChatGPT nicht in die richtige Richtung gelenkt wird, können sie diese spontan ändern.
Das Modell wird auch besser als bisher in der Lage sein, den Kontext zu bewahren, wenn es komplexere Befehle ausführt. GPT-5.4 wird in der Lage sein, mit großen Datenmengen zu arbeiten, ohne von seiner Kernaufgabe abzuweichen. Letztendlich wird dies dem Benutzer ermöglichen, Ergebnisse schneller zu erhalten und gleichzeitig qualitativ hochwertigere und genauere Antworten zu produzieren.
In allen Bereichen ist der GPT-5.4 eine Verbesserung gegenüber dem GPT-5.2, den das Unternehmen als seinen unmittelbaren Vorgänger bezeichnet. Im GDPval-Test konnte die bisherige Spitzenleistung von 70,9 Prozent auf 83 Prozent gesteigert werden, womit sogar der GPT-5.2 Pro weit übertroffen wird. Bei Aufgaben zur Tabellenkalkulation wurde die bisherige Genauigkeit von 68,4 Prozent auf 87,3 Prozent verbessert. Im MMMU-Pro-Framework ohne Add-ons erreicht GPT-5.4 81,2 % gegenüber 79,5 % zuvor. Beim Programmieren ergab der SWE-Bench Pro-Test ein etwas besseres Ergebnis, wobei die Arbeit in fast der Hälfte der Zeit erledigt werden konnte.
Nach Angaben von OpenAI macht das neue Modell 33 % weniger Fehler in jeder seiner Aussagen als GPT-5.2 und 18 % weniger Fehler in allen seinen Antworten. Für das Unternehmen war es wichtig, die Halluzinationen zu reduzieren, da ChatGPT auf diese Weise möglicherweise das Vertrauen der Nutzer gewinnen kann. Darüber hinaus wurden mehrere Sicherheitsfunktionen integriert und verbessert, um möglichen Missbrauch zu verhindern.
GPT-5.4 wird mit nativer Computernutzbarkeit als Teil des Codex und der API veröffentlicht werden, so dass Agenten auf dem fortgeschrittenen Modell basieren können. Damit wird er nicht nur zum Partner bei der Beantwortung komplexer Fragen, sondern auch bei der Bewältigung der komplexen Aufgaben, die mit der Verwaltung verschiedener Programme verbunden sind. Eine Million Token ist die unterstützte Kontextvorlage. Dabei ist die Token-Effizienz höher als je zuvor. Sie kann mit weniger Token als GPT-5.2 schnellere und bessere Antworten liefern.
Im Rahmen von ChatGPT wird GPT-5.4 Thinking GPT-5.2 Thinking für ChatGPT Plus, Team und Pro Abonnenten ersetzen. GPT-5.4 Pro wird allgemein für ChatGPT Pro- und Enterprise-Abonnenten verfügbar sein. Während OpenAI gesagt hat, dass die Effizienz deutlich verbessert wird, scheint es teurer geworden zu sein, das neue Modell zu verwenden.