Es gibt immer wieder übertriebene Erwartungen und unbegründete Gerüchte über OpenAI, die wahrscheinlich niemandem, der diese Nachrichten liest, vorgestellt werden müssen. Früher gab es ein Gerücht, dass das Unternehmen an einem völlig neuen Modell arbeitet, das alles in Bezug auf die Argumentation verändern könnte, eine neue Arbeitsweise mit sich bringt und intern als Strawberry bezeichnet wird. Manche hielten es für eine Ente, aber das neue Modell hat nun wirklich Fahrt aufgenommen.
Schließlich heißt Strawberry vorerst o1 und befindet sich laut OpenAI in einem so frühen Entwicklungsstadium, dass es sich noch in der "Preview"-Phase befindet. Trotzdem hat das Unternehmen einige erstaunliche Ergebnisse für das neue Produkt gemeldet, das wirklich eine Abkehr vom GPT-4o darstellt.
Das neue Modell arbeitet mit einer anderen Logik als frühere Lösungen und ist daher nicht unbedingt in jeder Hinsicht besser, aber insgesamt ist es für die Menschen natürlicher zu arbeiten, weil es einen menschenähnlichen Denkprozess hat. OpenAI hat schon früher davon gesprochen, dass sie künstliche Intelligenz menschlich machen will, aber das erfordert eine Menge Änderungen. Nun, o1 weist bereits in diese neue Richtung. Es ist viel besser als GPT-4o beim Lösen von mehrstufigen Aufgaben, beim Programmieren und bei Problemen mit mehrfacher Komplexität.
Der o1 unterscheidet sich auch in Bezug auf sein Training völlig vom GPT-4o, aber der Forschungsleiter Jerry Tworek machte nur vage Angaben dazu. "Er wurde mit einem völlig neuen Optimierungsalgorithmus trainiert, und das für das Training verwendete Datenpaket wurde speziell dafür entwickelt". - betonte der Unternehmenssprecher.
Im Falle von GPT-4o basiert das Training auf dem Erlernen von Mustern aus den verfügbaren Daten und der Nutzung dieser Muster, um sehr schnell zu reagieren. Im Gegensatz dazu erlernt o1 Problemlösungsfähigkeiten mit Hilfe von Lerntechniken, die denen des Menschen ähneln, wie z. B. Belohnung/Bestrafung. Dabei verwendet o1 eine Lösungskette, die dem menschlichen Denken ähnelt, aber dadurch wird es langsamer, aber seine Genauigkeit wird besser.
Was ist mit Halluzinationen? Nun, auch wenn es sich bei o1 um ein völlig neues Modell handelt, so zeichnet es sich doch durch die Fähigkeit aus, mit voller Überzeugung falsche Informationen zu übermitteln, selbst wenn diese keine Grundlage in den Tatsachen haben, aber das ist nicht dasselbe wie die gleichen Fehler zu machen. "Was wir bei diesem Modell sehen, ist, dass es weniger Fälle von Halluzinationen gibt. Aber wir können nicht sagen, dass wir das Problem gelöst haben". - betont Bob McGrew, Forschungsdirektor bei OpenAI.
Bob McGrew sagte auch, dass o1, obwohl er einen Universitätsabschluss in Mathematik hat, komplexe Rechenprobleme effizienter lösen kann als er. Er wurde gebeten, an der Internationalen Mathematik-Olympiade teilzunehmen, einer der am höchsten bewerteten Prüfungen, und schnitt unvergleichlich besser ab als GPT-4o. Das o1-Modell erzielte 83 %, während das am weitesten fortgeschrittene GPT-4o 13 % zurücklag. Seine Fähigkeiten gehen weit über das Lösen einer Reihe von Abschlusstests hinaus.
Sie haben o1 auch eine Programmieraufgabe gestellt, und er hat besser abgeschnitten als 89 % derjenigen, die die Codeforce-Aufgabe gelöst haben. Und die Grenzen sind fließend: Die nächste Herausforderung richtet sich an Doktoranden der Physik, Chemie und Biologie.
Der Name o1 kommt von der Tatsache, dass dieses Modell auf eine völlig andere Art und Weise funktioniert und eine neue Art der Betrachtung von Möglichkeiten darstellt. McGrew merkte an, dass sie seiner Meinung nach sehr schlecht darin sind, Dinge zu benennen, aber er ist zuversichtlich, dass dieser Name der erste Schritt ist, um auch darin besser zu werden. Nun, jeder möge selbst entscheiden, wie gut sich der Name o1 bewährt hat.
Die Kosten für die verschiedenen Sprachmodelle gehen weit auseinander, und o1 gehört zur extrem teuren Kategorie. OpenAI preist GPT-4o bereits recht teuer an: 1 Million Token kostet $5 für die Verarbeitung und 1 Million Token $15 für die Ausgabe. Im Vergleich dazu kostet das GPT-4o Mini-Modell 0,15 $ für die Verarbeitung von 1 Million Token und 0,6 $ für die Erzeugung von 1 Million Token. Beim o1 kostet die Verarbeitung von 1 Million Token auf der Eingabeseite 15 $ und die Ausgabe der gleichen Menge an Daten 60 $.
Um o1 erschwinglicher zu machen, hat OpenAI sofort das Modell o1 mini auf den Markt gebracht, das in Bezug auf die Fähigkeiten etwas eingeschränkter und weniger genau ist, dafür aber auch preiswerter. Es kostet $3 für die Eingabe von 1 Million Token und $12 für die Ausgabe von 1 Million Token. o1 mini wird sicherstellen, dass ein breiteres Publikum das Potenzial des Modells erkunden kann.
ChatGPT Plus- und ChatGPT Team-Abonnenten können bereits das o1-Vorschaumodell und o1 mini ausprobieren, und alle anderen Abonnenten werden bald in der Lage sein, dies zu tun. OpenAI schränkt den Zugang ein, aber das ist nicht neu, sondern zu erwarten. Das Unternehmen hat auch gesagt, dass es beabsichtigt, o1 kostenlos zur Verfügung zu stellen, aber es gab kein Wort darüber, wann dies der Fall sein könnte. Sie fügten hinzu, dass aus offensichtlichen Gründen nur das o1 Mini-Modell kostenlos sein würde.