Kategorien

MICROSOFTS EIGENES SPRACHMODELL MIT BILDERZEUGUNG IST DA

Das neue Instrument kann erstmals über den Bing ausprobiert werden, aber davor werden wir von der EU vorerst "geschützt".
DemonDani
DemonDani
Microsofts eigenes Sprachmodell mit Bilderzeugung ist da

Microsoft hat in den letzten Jahren sehr viel Geld in OpenAI investiert und versucht, OpenAI-Technologien in seine eigenen Produkte zu integrieren. Inzwischen hat das Unternehmen aber auch damit begonnen, eigene Sprachmodelle und KI-basierte Tools zusammenzustellen, und hat nun seine Lösung zur Bilderzeugung auf den Markt gebracht.

Das Modell heißt MAI-Image-1 (Microsoft AI) und wurde von den Redmondern in zwei Produkten eingeführt. Zum einen wurde es im Bing Image Creator eingesetzt, der sich selbst verraten hat, und zum anderen wurde es unter dem Dach von Copilot Audio Expressions eingesetzt, was ein wenig seltsam klingt.

Microsoft hatte bereits angekündigt, dass es sich mit seinem Text-zu-Bild-Modell für die Erstellung von Bildern auf der Zielgeraden befindet, und MAI-Image-1 wird nun wirklich häufig verwendet. Bing Image Creator verwendete zunächst DALL-E, wie es von OpenAI eingesetzt wird, und dann wurde GPT-4o eingeführt, und Microsofts neuer Zusatz zu diesen Modellen wird nun verfügbar sein.

Das Unternehmen sagt, dass MAI-Image-1 in der Lage ist, fotorealistische Inhalte zu erstellen und auch naturgetreue Bilder von Licht zu liefern. Es kann Naturphänomene in Verbindung mit realer Physik darstellen, Landschaften erzeugen, Tiere sehr schön rendern und so weiter. Microsofts Lösung ist außerdem schnell, und den Entwicklern ist es gelungen, hohe Geschwindigkeit mit hervorragender Qualität zu verbinden, was nicht typisch ist für artificial intelligence tools.

Galerie öffnen

Ausgehend davon benötigt es wahrscheinlich nicht allzu viel Rechenleistung, was unter dem Gesichtspunkt einer umfassenden Nutzung von Microsoft positiv sein könnte, aber dazu lagen keine Informationen vor.

Hinter dem Copilot Audio Expressions-Dienst steht das MAI-Image-1-Modell, das es der KI ermöglicht, Illustrationen und Kunstwerke neben dem mit derselben generativen KI erstellten Audiomaterial zu erstellen. Der Dienst wird über einen Story-Modus verfügen, den das Unternehmen durch Bilderzeugung zu ergänzen versucht, um den Nutzern ein umfassenderes Erlebnis zu bieten.

Galerie öffnen

Es ist eine gute Nachricht, dass wir in der Europäischen Union immer noch hinter dem MAI-Image-1-Modell zurückbleiben. Die EU hat derzeit einige der strengsten KI-Vorschriften der Welt, und fast alle Entwicklungen kommen deshalb etwas langsamer bei den europäischen Bürgern an, was in vielen Fällen erfahrungsgemäß keine schlechte Sache ist.

Microsoft ist mit seinen eigenen Entwicklungen im Vergleich zu Google und OpenAI stark im Rückstand, aber es macht langsam Fortschritte in allen Bereichen. Das Unternehmen hat bereits sein Spracherzeugungsmodell MAI-Voice-1 vorgestellt und auch das Sprachmodell MAI-1-Preview für generative KI-Chatbots auf den Markt gebracht.

Das MAI-1-Modell, das hinter dem KI-Assistenten Copilot steht, soll in Zukunft eingesetzt werden, aber wann dies geschehen wird, ist noch nicht bekannt. Derzeit verwendet Copilot hauptsächlich das GPT-5, aber auch das neueste Claude ist verfügbar. Vorerst wird es interessant sein zu sehen, wie das MAI-Image-1 im Vergleich zu den Modellen DALL-E 3 und GPT-4o abschneidet, die ebenfalls in Bing Image Creator verfügbar sind. Wir können sicher sein, dass es bald Vergleiche geben wird, auch wenn wir aufgrund der EU-Beschränkungen vorerst keine Möglichkeit haben werden, sie aus erster Hand zu sehen.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang