Kategorien

MICROSOFTS ERSTES ALLGEMEINES ARGUMENTATIONSMODELL WIRD GEBOREN

Der Software-Gigant hat auf der Build den Kopf der MAI-Modellfamilie zusammen mit einer Reihe anderer Modelle vorgestellt.
DemonDani
DemonDani
Microsofts erstes allgemeines Argumentationsmodell wird geboren

Microsoft AI, oder kurz MAI, hat sich in diesem Jahr ziemlich dynamisch entwickelt, und Redmond hat sich die wichtigste Ankündigung für die Entwicklerkonferenz Build 2026 aufgehoben. Es sieht ganz danach aus, als wolle das Unternehmen langsam die Kontrolle über die Entwicklung aller Künstliche Intelligenz Tools übernehmen, anstatt sich auf die Lösungen anderer zu verlassen.

In der Vergangenheit hat Microsoft Milliarden von Dollar in die Unterstützung von OpenAI und Anthropic gesteckt, zusätzlich zur Finanzierung kleinerer Projekte. Irgendwann kam das Unternehmen jedoch zu dem Schluss, dass diese Strategie nicht ideal ist und dass es mit solchen Investitionen seine eigenen maßgeschneiderten Modelle entwickeln könnte. Bereits im Mai wurde gemunkelt, dass das Unternehmen eine Reihe von Verträgen mit seinen Partnern, darunter Claude Code, kündigen würde.

Und auf der Build 2026 kündigte das Unternehmen die Ankunft von MAI-Thinking-1 an, seinem ersten echten Flaggschiff, einem Denkmodell, das mit Gemini, GPT und Claude konkurrieren kann. Es soll von Grund auf von den Redmondern mit "reinen Daten" trainiert worden sein und hat keinerlei Verbindung zu Entwicklungen von Drittanbietern - keine aus anderen Modellen extrahierten Daten dienten als Grundlage für das Training.

Galerie öffnen

Durch die Nutzung seiner fortschrittlichen Denkfähigkeiten wird es sich bei der Lösung komplexer mathematischer Probleme auszeichnen und bei Herausforderungen in der Softwareentwicklung gut abschneiden. Es ist geplant, dass Microsoft das MAI-Thinking-1-Modell in seinen eigenen Diensten einsetzt und dass sein Ingenieurteam intern damit arbeitet. Microsoft hat jedoch noch nicht allzu viele Einzelheiten über sein Denkmodell der ersten Generation bekannt gegeben.

Nach Angaben des Unternehmens handelt es sich derzeit um ein Mittelklassemodell, das in Bezug auf den Parametersatz nicht auf dem Niveau eines echten Spitzenmodells angesiedelt ist. Es verwendet eine MoE-Architektur mit insgesamt 1 Billion Parametern, von denen bis zu 35 Milliarden gleichzeitig aktiv sein können. Die anderen Entwickler fangen nicht unbedingt mit den größten Modellen an, wenn sie eine neue Entwicklung starten (Gemini 3.5 war das erste, das Flash verwendet hat). Microsoft hat auch angedeutet, dass die Reaktion von MAI-Thinking-1 in Blindtests besser bewertet wurde als die von Claude Sonnet 4.6, aber wir wissen, dass es bei weitem nicht das beste Werkzeug von Anthropic ist.

Galerie öffnen

Auf der Build hat Microsoft mehrere Modelle angekündigt, die sich auf einen bestimmten Bereich konzentrieren. Eines dieser Modelle ist MAI-Code-1-Flash, das die Lösung von Programmieraufgaben unter dem Gesichtspunkt der Effizienz angehen wird. Es wird extrem billig im Betrieb sein, so dass man mit einem minimalen Budget lange Zeit damit arbeiten kann. Es ist im Prinzip vom Unternehmen in erster Linie für GitHub Copilot konzipiert und wird mit 5 Milliarden aktiven Parametern laufen. Berichten zufolge wird er sogar wirtschaftlicher arbeiten als Modelle ähnlicher Größe und Leistungsfähigkeit.

Das Unternehmen hat auch ein Modell speziell für die Erstellung von Texttranskripten entwickelt, MAI-Transcribe-1.5, von dem das Unternehmen behauptet, es sei "das beste Transkriptionsmodell der Welt" und arbeite mit besserer Genauigkeit als je zuvor. Microsoft berichtet, dass es auch in technischen Sprachen gut funktioniert, angefangen bei 43 Sprachen, und bis zu fünfmal schneller sein könnte als seine Konkurrenten. Auch MAI-Voice-2 wird kommen, das natürliche Sprachklänge in 15 Sprachen erzeugen wird. Eine Flash-Version davon ist bereits in der Entwicklung und wird wahrscheinlich in digitalen Assistenten eingesetzt werden.

Galerie öffnen

Schließlich wird auch das Modell MAI-Image-2.5 verfügbar sein, das sich auf die Bilderzeugung konzentrieren wird. Microsoft hat MAI-Image-2 bereits im März auf den Markt gebracht und es in Bezug auf die Qualität mit den besten Modellen gleichgestellt, und der Neuling liegt bereits vor dem Nano Banana Pro. Das Unternehmen hat ein "Text-zu-Bild-Modell von Weltklasse" entwickelt, und in Kürze wird eine Flash-Version auf den Markt kommen, die einen besonders effizienten Betrieb verspricht.

Es wird interessant sein zu sehen, wie die Benutzer auf die verschiedenen Sprachmodelle von Microsoft reagieren. Der Softwareriese setzt jedenfalls große Hoffnungen in sie. Alle diese Tools sind reine Eigenentwicklungen, worauf das Unternehmen sehr stolz ist.

Für den Newsletter anmelden
Mit meiner Registrierung akzeptiere ich die Nutzungsbedingungen und die Datenschutzerklärung.

Wir empfehlen Ihnen gerne

    Tests

      Diesbezügliche Artikel

      Zurück zum Seitenanfang