OpenAI führt weiterhin das Rennen um KI-Dienste an, aber die Konkurrenten tun ihr Bestes, um an der Spitze zu bleiben. ChatGPT, das von OpenAI entwickelt wurde, ist schon seit einiger Zeit in der Lage, Bilder zu bearbeiten, und jetzt bekommt Gemini, das unter dem Dach von Google steht, die gleiche Entwicklung.
Die Entwickler arbeiten schon seit einiger Zeit daran, Gemini in die Lage zu versetzen, einfache Bildbearbeitungsaufgaben zu erledigen, und jetzt beginnt Google, diese Fähigkeit auf breiter Basis einzuführen. Sowohl die Weboberfläche als auch die mobile App werden es den Nutzern ermöglichen, Bilder zur Bearbeitung in den Chatbot hochzuladen. Das Unternehmen gab die guten Nachrichten in einem separaten Blogbeitrag bekannt.
Mit der künstlichen Intelligenz kann jeder auf einen Schlag zum "Photoshop-Assistenten" werden, indem er einem Nutzer einfach schreibt, was er an einem hochgeladenen Bild ändern möchte, und die generative KI macht sich an die Arbeit. Verschiedene Änderungsoptionen können von Gemini angefordert werden, und mit der Zeit wird sie in diesem Bereich immer besser werden. Es befindet sich noch in einem relativ frühen Stadium der Bildbearbeitung, aber es ist bereits zu großen Dingen fähig.
Gemini kann das Problem des Entfernens von Teilen eines Bildes, die nicht passen, lösen, so dass es für hochwertige Retuschen verwendet werden kann. Es ist auch in der Lage, verschiedene Objekte in freigegebenen Bildern mit künstlicher Intelligenz zu ersetzen. Es wird auch möglich sein, den gesamten Hintergrund eines Fotos zu ändern, so dass Menschen, Objekte und Tiere in Sekundenschnelle in eine völlig andere Umgebung gesetzt werden können.
Und Gemini wird noch viele weitere Möglichkeiten bieten, Fotos zu verändern. Google hat nicht alles aufgezählt, ist aber zuversichtlich, dass begeisterte Nutzer bald das große Potenzial dieser neuen Funktion entdecken werden. Als Beispiel nannte er die Möglichkeit, die Haarfarbe der Personen auf dem Bild zu ändern. Es wurde jedoch nicht erwähnt, ob es möglich sein wird, hochgeladene Bilder im Stil anderer Bilder zu gestalten, was bei ChatGPT im Moment sehr cool ist.
Im Prinzip wird es möglich sein, die von Gemini erstellten Bilder zu bearbeiten, um sie zu perfektionieren. Es wird möglich sein, ein Bild in mehreren Schritten zu bearbeiten, so dass Sie nach und nach die gewünschte Form Ihrer Aufnahme erreichen können. Sie können zuerst kleinere Bearbeitungen vornehmen, gefolgt von größeren Änderungen, oder Sie können in umgekehrter Reihenfolge arbeiten. Sie können auch mehrere Versionen einer einzigen Anweisung anfordern, wenn den Leuten die erste Änderung nicht gefällt.
Bei solchen Bildbearbeitungswerkzeugen besteht immer die Gefahr, dass das fertige Material missbraucht wird. Insbesondere hat Google erklärt, dass es in diesem Fall beabsichtigt, sich gegen Deepfake zu schützen, so wie es in der Vergangenheit bei der allgemeinen Bilderzeugung geschehen ist. Mit Gemini erstellte Bilder werden immer mit einem Wasserzeichen des Dienstes versehen. Dabei wird die für das Auge unsichtbare SynthID verwendet, die jede Form von durch KI erstellten Inhalten aufdecken kann. Gleichzeitig wird auch ein sichtbares Wasserzeichen auf den Inhalt aufgebracht.