Google brachte letztes Jahr das Bildmodell Nano Banana auf den Markt, das im Vergleich zu früheren Geräten zur Bilderzeugung eine derartige Verbesserung darstellte, dass es plötzlich zu einem großen Erfolg wurde. Es befindet sich in einer ähnlichen Position wie Veo 3, das sich auf die Erstellung von Videos spezialisiert hat. Nano Banana wurde im August veröffentlicht, gefolgt von Nano Banana Pro im November, und jetzt gibt es das neueste Update.
Der Nano Banana 2 ist ein sehr komplexes, aber leichtes Modell geworden, das von Google entwickelt wurde, um die Vorzüge des Nano Banana und des Nano Banana Pro so weit wie möglich zu übernehmen. Es wird die hervorragende visuelle Funktionalität und die Denkfähigkeiten haben, die wir bereits vom Nano Banana Pro kennen, und es wird sehr wendig sein, wie man es schon vom Nano Banana kennt.
"Sie erhalten jetzt das fortschrittliche Weltbewusstsein, die Qualität und das logische Denken, das Sie gewohnt sind, mit der Geschwindigkeit, die Sie brauchen, um Ihre wildesten Ideen in die Realität umzusetzen." - hob Google hervor.
Das Unternehmen bietet das Modell Gemini 3.1 Flash Image unter dem Namen Nano Banana 2 an, aber der Name "Fun Banana Fantasy" hat sich schon früher durchgesetzt, also hat es ihn beibehalten. Das klare Ziel der Entwicklung war es, ein sparsameres Gerät zu produzieren, das auch anspruchsvolle Aufgaben bewältigen kann. Es muss sich auch bei der Texterstellung gut verhalten, was bei Nano Banana noch nicht so gut gelungen ist, und es muss Anweisungen gut befolgen können.
Unter der Oberfläche gibt es einige sehr aufregende Entwicklungen, zum Beispiel wird das Modell jetzt über ein Echtzeit-Bewusstsein verfügen, indem es in der Lage ist, Websuchen auszulösen, um Anfragen zu erfüllen. So kann es beispielsweise ein Bild erstellen, das die aktuellen Wetterbedingungen widerspiegelt, die der Nutzer gerade erlebt. Wenn man ihm sagt, es solle einen Schnappschuss von einer Straße in Budapest machen, wird es regnen, wenn es in der Hauptstadt regnet.
Google hob besonders hervor, dass Nano Banana 2 in der Lage sein wird, vorhandene Plakate und Broschüren zu übersetzen und zu lokalisieren. Außerdem wird es in der Lage sein, den Text auf den Bildern geschickt darzustellen, was zum Beispiel für Vermarkter, Comic-Fans eine gute Nachricht ist. Das neue Bildmodell ist auch in der Lage, die Konsistenz von Personen und Objekten in verschiedenen Szenen zu wahren. Bis zu fünf Personen und 14 verschiedene Objekte können mit dem neuen Werkzeug Bild für Bild in einem einzigen Workflow beibehalten werden.
Die Nano Banana 2 wird es den Entwicklern auch ermöglichen, die Argumentationsfähigkeiten des Modells bei Bedarf zu optimieren. Es wird eine minimale Einstellung haben, bei der es Bilder in Windeseile erstellt, und es wird auch möglich sein, auf eine hohe Einstellung umzuschalten, bei der es zwar langsamer Bilder erstellt, dafür aber komplexe Eingabeaufforderungen beim Rendern effizienter verfolgt. Hier wird das Verfolgen von Eingabeaufforderungen besonders hervorstechen. Eine weitere wichtige neue Funktion ist, dass Sie Lichter und Texturen auf viel spektakulärere Weise darstellen können, während Sie gleichzeitig Bilder schnell erstellen.
Eine weitere Neuerung von Nano Banana 2 ist, dass es jetzt in der Lage ist, mehr spezielle Seitenverhältnisse wie 4:1 und 8:1 sowie deren Umkehrung, 1:4 und 1:8, zu verarbeiten. Außerdem können weiterhin Auflösungen von 1K, 2K und 4K verarbeitet werden. Die Gemini-App wird auch Vorlagen zur Inspiration bereitstellen, und die Sicherheit wird weiterhin durch das SynthID-Wasserzeichenverfahren gewährleistet, das den neuesten Richtlinien zur Authentifizierung von Inhalten entspricht.
Das Unternehmen hat das neue Bildmodell sofort ins kalte Wasser geworfen. Von nun an werden alle Bilder in Gemini von Nano Banana 2 erstellt, das Nano Banana und Nano Banana Pro ersetzt. Google ist sehr zuversichtlich über die Qualität des neuen Geräts.
Der neue Gemini-Chatbot wird die Aufgabe der Bilderzeugung für das neue Produkt in den Modi Flash, Thinking und Pro übernehmen. Es ist nicht bekannt, ob es einen Qualitätsunterschied zwischen diesen Modi geben wird. Das Unternehmen überlässt es den Nutzern, dies herauszufinden. Entwickler werden in Zukunft mit dem Chatbot als Teil der Gemini-API, Vertex AI, Firebase und Google Antigravity arbeiten können, und er wird auch über Google AI Studio verfügbar sein.
Google wird Nano Banana 2 auch in den Suchdienst integrieren. Es wird im KI-Modus-Framework verfügbar sein und auch in Google Lens verwendet werden. Es wird auch seinen Weg in alle anderen Google-Anwendungen finden, die Bilderzeugungsfunktionen anbieten. Unabhängig davon hat das Unternehmen bekannt gegeben, dass Flow es ebenfalls standardmäßig verwenden wird, und dass es prinzipiell möglich sein wird, bei der Produktion von Videos damit zu arbeiten, ohne Credits zu verwenden. Auch Google Ads wird Nano Banana 2 für Anzeigenersteller anbieten.
Wahrscheinlich wird Google in Zukunft auch ein Nano Banana 2 Pro Modell anbieten, das nicht auf der Gemini Flash Serie basiert, sondern auf einem der größeren Modelle. Alternativ wird die bisherige Nano Banana Pro weiterhin erhältlich sein, für diejenigen, die das AI Pro oder AI Ultra Paket von Google abonnieren. Es scheint, dass es in bestimmten Situationen immer noch nützlich sein könnte, und Google hat die Nano Banana Pro für "spezielle Aufgaben" behalten.