Kategorien

CLAUDE WIRD MIT DEM NEUEN MODELL OPUS NOCH BESSER IM PROGRAMMIEREN

Anthropic hat die Version 4.8, die Opus 4.7 ablöst, schnell zur Verfügung gestellt, und das neue Tool stellt in vielerlei Hinsicht eine erhebliche Verbesserung dar.
DemonDani
DemonDani
Claude wird mit dem neuen Modell Opus noch besser im Programmieren

Etwas mehr als einen Monat nach Opus 4.7 ist das neue Spitzenmodell von Anthropic auf den Markt gekommen, das einen Schritt nach vorn in Sachen Effizienz, Genauigkeit, Argumentationsfähigkeit und Agentenbetrieb darstellt. Die Grundlagen haben sich jedoch nicht geändert. Das Unternehmen hat versucht, das Beste aus dem bestehenden Opus in einem hart umkämpften Markt herauszuholen.

"Claude Opus 4.8 ist das bisher leistungsfähigste und am weitesten verbreitete Modell von Anthropic. Es baut auf Claude Opus 4.7 auf." - betonte das Unternehmen. "Es ist das leistungsstärkste Modell von Anthropic in Bezug auf komplexes Denken, einen langlaufenden Programmieragenten und erweiterte Autonomie."

Die Leistung von Claude Opus 4.8 wird sich vor allem bei Aufgaben zeigen, bei denen ein wirklich komplexer, mehrstufiger Arbeitsablauf bewältigt werden muss, um das richtige Ergebnis zu erzielen. Dazu gehören Codierung, Forschung und Arbeiten auf Systemebene. In diesen Bereichen schneidet das neue Modell in den breit angelegten Tests besser ab als fast alle Vorgängermodelle.

Im SWE-Bench Pro-Test erzielte Google Gemini 3.1 Pro 54,2 Prozent und GPT-5.5 58,6 Prozent, während Claude 4.8 mit einem Rekordwert von 69,2 Prozent abschnitt - ein großer Sprung sogar im Vergleich zu Opus 4.7. In Finance Agent v2, das sich auf finanzielle Herausforderungen konzentriert, kann der Newcomer eine Leistung von 53,9 Prozent vorweisen, während die besten Modelle bis dato eine Leistung von rund 51 Prozent erreicht haben. Humanity's Last Exam erreichte auch ohne die Tools einen Rekordwert von 49,8 Prozent, während GPT-5.5 nur 41,4 Prozent und Gemini 3.1 Pro nur 44,4 Prozent schafften.

Galerie öffnen

Anthropic sagte, dass das neue Modell im Vergleich zu Claude 4.7 ein Viertel weniger Kodierungsfehler in den Prüfungen hinterlässt, weshalb es sich als ein viel nützlicherer Assistent für die Programmierung erweisen wird. Es wird stabiler in Situationen sein, in denen eine große Menge an Kontext befolgt werden muss und das "Denken" in mehreren Schritten erfolgen muss. Und wenn er sich bei einer Antwort unsicher ist, wird er sich um mehr Transparenz bemühen, was bei Halluzinationen wichtig sein wird.

Die Begrenzung der Länge der zwischenspeicherbaren Eingabeaufforderungen durch Anthropic wurde verringert. Die Nutzung des Chatbots mit künstlicher Intelligenz kann durch die Verwendung der Cache-Funktion kostengünstiger gestaltet werden, aber in Claude 4.7 musste ein cachefähiger Prompt mindestens 4096 Token lang sein, jetzt sind 1024 Token ausreichend. Dies ermöglicht Claude, mehr kleine Informationen zu speichern.

Galerie öffnen

Die Funktion "Dynamische Workflows" wurde als Teil des Programmierdienstes eingeführt und ist nun darauf ausgelegt, umfassende technische Herausforderungen zu bewältigen. Auch die Skalierbarkeit wurde mit dem Update verbessert, so dass die Nutzung nun kostengünstiger ist. Außerdem wird es einen neuen schnellen Modus geben, der 2,5 Mal schneller ist und bis zu einem Drittel des Preises kostet.

Mit einem Kontextfenster von 1 Million Token wurde Claude Opus 4.8 veröffentlicht. Im normalen Modus kostet die Eingabe dieser Menge an Informationen 5 $, und auf der Ausgabeseite kostet sie 25 $. Die Kosten variieren stark je nach den verschiedenen Einstellungen.

Anthropic hat mit der Einführung von Claude Opus 4.8 nicht gewartet, sondern stellt es den Nutzern bereits über die Weboberfläche, innerhalb von Claude Code, hinter Cowork und dem API-Zugang zur Verfügung. Während diese Entwicklung ausgerollt wird, verriet das Unternehmen auch, dass im Hintergrund bereits ein viel fortschrittlicheres KI-System als bisher in Arbeit ist, das einen großen Sprung nach vorne bringen wird.

Für den Newsletter anmelden
Mit meiner Registrierung akzeptiere ich die Nutzungsbedingungen und die Datenschutzerklärung.

Wir empfehlen Ihnen gerne

    Tests

      Diesbezügliche Artikel

      Zurück zum Seitenanfang