Google arbeitet unermüdlich daran, Nutzer, die sich für künstliche Intelligenz interessieren, zu Gemini zu führen. Es gibt ständig neue Funktionen heraus und versucht, Gemini überall zu integrieren, während der Chatbot selbst in Bezug auf die Leistung noch hinter OpenAIs ChatGPT zurückbleibt.
In der speziellen Gemini-App haben sich die Entwickler in letzter Zeit auf die Live-Funktion konzentriert, die sie auf die nächste Stufe bringen wollen, um die Menschen zu begeistern.
Mit Gemini Live wird die generative KI bald in der Lage sein, mehr zu tun als nur mit Nutzern über das zu sprechen, was sie durch die Kamera sieht. Die Entwickler arbeiten daran, Gemini dazu zu bringen, zu zeigen, was in ihm steckt. In der Live-Kameraansicht wird die App in der Lage sein, das zu umrahmen, was man hervorheben möchte. Das wird die Interaktion zwischen Mensch und KI noch interaktiver machen.
Wenn ein Nutzer die Kamera auf ein Regal voller Gewürze richtet und Gemini fragt, welche Gewürze für ein bestimmtes Gericht benötigt werden, kann Gemini das Kamerabild einrahmen und die Gewürze hervorheben, die aus dem Regal geholt werden müssen. Wenn Sie sich nicht aussuchen können, welches Buch Sie gerade lesen, können Sie Gemini Ihr Regal zeigen, ihm sagen, welche Art von Lektüre Sie wünschen, und die KI wird das Buch auf dem Regal einrahmen, das Sie für ideal halten.
Diese Funktion kann auch im Laden nützlich sein, wo Gemini Live einfach das Regal im Spielzeugladen zeigen und dem Benutzer sagen kann, für wen er ein Geschenk kaufen möchte. Gemini versucht dann, das am besten geeignete Geschenk zu erraten und es im Regal zu markieren, ohne dass der Kunde danach suchen muss und ohne dass die Gefahr besteht, dass er das falsche Produkt in seinen Einkaufskorb legt. In vielen Situationen wird es nützlich sein, dass Gemini in der Lage ist, genau auf Objekte oder andere Dinge im Kamerabild zu zeigen.
Eine weitere neue Funktion von Gemini Live wird die Möglichkeit sein, mit mehr und mehr Apps auf Smartphones zu interagieren. Während Live-Gesprächen wird es in der Lage sein, eine Textnachricht an eine Telefonnummer zu senden, die der Nutzer über die Kamera an die KI zeigt. Sie werden in der Lage sein, Alarme und Benachrichtigungen basierend auf einer Zeit einzustellen, die Sie Gemini auf einem Poster zeigen.
Für den Moment hat Google die Unterstützung für die Uhr-, Nachrichten- und Dialer-Apps angekündigt, aber diese Liste wird in Zukunft schrittweise erweitert werden. Gemini Live wird zunehmend in der Lage sein, mehr und mehr Aufgaben auf Smartphones zu erledigen, ohne dass der Nutzer direkt eingreifen muss, und zwar auf der Grundlage komplexer und ausgefeilter Sprachbefehle.
Schließlich gab Google bekannt, dass Gemini Live bald über deutlich verbesserte Sprachfunktionen verfügen wird. Es wird in der Lage sein, in seinem Sprachmodus Sprachverbiegungen viel besser zu nutzen, einen besseren Sprachrhythmus zu haben und besser mit seinem Tonfall zu spielen. Das Ergebnis wird ein viel natürlicherer Klang sein als jetzt. In dieser Hinsicht hat Gemini einen großen Nachteil gegenüber ChatGPT, so dass wir hoffen, dass Google es wirklich schaffen wird, eine gute Verbesserung zu erzielen.
Darüber hinaus wird Google es ermöglichen, die Sprechgeschwindigkeit von Gemini besser zu kontrollieren. Dies bedeutet, dass jeder in der Lage sein wird, die Geschwindigkeit und den Rhythmus der Stimme des Chatbots an seine eigenen Bedürfnisse anzupassen. Interessanterweise wird Gemini Live auch in der Lage sein, mehr oder in einem angenehmeren Tempo zu sprechen, da es in der Lage ist, den emotionalen Zustand einer Person zu einem bestimmten Thema zu erkennen. Wenn Sie über etwas Aufregendes sprechen, können Sie schneller in das Thema einsteigen, und wenn es sich um etwas Ruhiges handelt, können Sie es langsamer angehen.
Gemini Live wird in Zukunft auch eine sehr wichtige Rolle im Smart Home spielen, Google arbeitet bereits an Gemini for Home. Deshalb ist es wichtig, dass diese Funktion mit der höchstmöglichen Qualität arbeitet, da sie dann in der Lage sein wird, eine gute Nutzererfahrung mit allen Diensten des Unternehmens zu bieten.