Neuer Bildgenerator, der mit ChatGPT und Gemini konkurrieren soll

NEUER BILDGENERATOR, DER MIT CHATGPT UND GEMINI KONKURRIEREN SOLL

Das von Microsoft entwickelte Modell der neuen Generation schneidet in den ersten Tests sehr gut ab und belegt einen hohen Platz im LMArena-Ranking.

DemonDani

Microsoft versucht, die Nase vorn zu haben. Das erste große Update des MAI-Image-Modells zeigt nach Angaben des Unternehmens ordentliche Fortschritte und tritt in die Fußstapfen der führenden Geräte. Darüber hinaus ist diese Entwicklung recht schnell erfolgt, was ein gutes Vorzeichen für zukünftige Innovationen ist.

Microsoft hat sich bei seinen eigenen Sprachmodellen ein wenig zurückgehalten, aber MAI-Image-2 sieht jetzt ziemlich robust aus. Das Unternehmen kündigte das Modell MAI-Image-1, das Bilder auf der Grundlage von Textanweisungen generieren kann, am 13. Oktober letzten Jahres an, und weniger als sechs Monate später ist die aktualisierte Version nun in Arbeit.

MAI-Image-2 ist ein generatives KI-Modell, das von Microsofts KI-Team mit dem Ziel entwickelt wurde, die Kreativität der Nutzer zu erweitern und sie bei Designaufgaben zu unterstützen. Das Modell kann auch "teilweise" fotorealistische Bilder erzeugen, sagt das Unternehmen. MAI-Image-2 wird in die verschiedenen Dienste des Unternehmens integriert werden und zunächst über MAI Playground verfügbar sein.

Nach Angaben der Redmonder schneidet MAI-Image-2 in verschiedenen Tests in allen Bereichen besser ab als MAI-Image-1. Die größte Verbesserung gab es bei der Darstellung von Text. Dies ist ein Bereich, in dem die meisten Bildgeneratoren noch Raum für Verbesserungen haben, da die Textdarstellung die höchste Genauigkeit auf der Ebene der feinen Details erfordert. Darüber hinaus hat sich MAI-Image-2 bei der Erstellung von Szenen mit filmischen Effekten und fotorealistischen Bildern sowie bei Porträtaufnahmen stark verbessert.

Die LMArena-Rangliste wird derzeit vom Nano Banana 2 (Gemini 3.1 Flash) mit 1266 Punkten angeführt, und der GPT-Image 1.5 liegt auf dem zweiten Platz. Das MAI-Image-2 liegt mit 1189 Punkten noch dahinter, aber die neuesten Versionen des Grok, Qwen und Flux liegen bereits dahinter. Nur die Spitzenreiter liegen vor der neuesten Version von Microsoft, und darauf ist der Software-Riese besonders stolz.

Laut technischem Datenblatt kann MAI-Image-2 nur Material mit einer Auflösung von 1024 x 1024 Pixel erzeugen und arbeitet mit 32.000 Token-Kontextfenstern. Letzteres wird das Tool in der Praxis wahrscheinlich nicht einschränken, aber es gibt noch viel Spielraum für Verbesserungen bei der Auflösung, um das Modell für ernsthafte Arbeiten geeignet zu machen.

Auch um die Sicherheit des MAI-Image-2 wird sich gekümmert. Das Microsoft AI Red Team hat seine Funktionsweise in mehreren Runden analysiert. Das Unternehmen betonte, dass bei der Entwicklung besonders sorgfältig darauf geachtet wurde, dass potenzieller Missbrauch richtig gehandhabt wird. Das Modell filtert zuverlässig Anweisungen, die die häufigsten Risikobereiche berühren, auch wenn sie auf mehreren Ebenen nuanciert sind. Beispiele hierfür sind Aufforderungen zu gewalttätigen und sexuellen Inhalten.

Microsoft hat bisher mehrere Milliarden Dollar an OpenAI gezahlt, um unter anderem Copilot und Bing mit bildgebenden Tools der künstlichen Intelligenz auszustatten. Die Veröffentlichung von MAI-Image-2 ist eine eher schlechte Nachricht für das Startup, das sich im Laufe der Jahre zu einem Giganten entwickelt hat, denn es ist wahrscheinlich nur eine Frage der Zeit, bis das Unternehmen auf seine eigenen Tools umsteigt. OpenAI könnte dadurch erhebliche Einnahmen verlieren.

nicht erhältlich

Ihr Warenkorb ist noch leer.

Produkt

nicht erhältlich

NEUER BILDGENERATOR, DER MIT CHATGPT UND GEMINI KONKURRIEREN SOLL

TOP 5 AUF IPON