Kategorien

GOOGLE KÜNDIGT DAS SPRACHMODELL GEMINI 2.0 AN

Die Entwicklung der künstlichen Intelligenz schreitet rasant voran, und Google hat gerade die kleinste Version von Gemini 2.0 vorgestellt.
DemonDani
DemonDani
Google kündigt das Sprachmodell Gemini 2.0 an

Vor einem Jahr kündigte Google das Sprachmodell Gemini an, das bereits auf Multimodalität ausgelegt ist. Damals bezeichnete das Unternehmen es als "das größte und leistungsfähigste KI-Modell". Seitdem hat Gemini mehrere größere Aktualisierungen erfahren, zuletzt Gemini 1.5 im Frühjahr und jetzt Gemini 2.0.

OpenAI, Microsoft, Google, Meta, Anthropic, Amazon und xAI liefern sich einen ständigen Kampf auf dem Gebiet der großen Sprachmodelle und generativen KI-Dienste. Es ist ziemlich schwierig, den Überblick darüber zu behalten, welche Anbieter wo entwickeln. Jetzt hat Google zum Beispiel die neueste Hauptversion von Gemini angekündigt, aber ab jetzt wird nur noch eine Nebenversion verfügbar sein. Der Gemini 2.0 Flash ist die erste einer Reihe, die für Tests zur Verfügung gestellt wurde.

Demis Hassabis, CEO von DeepMind, sagte, dass ihre Verbesserungen Gemini 2.0 Flash so gut arbeiten lassen, dass es Gemini 1.5 Pro übertreffen kann. Die beiden Modelle sind in ihrer Größe nicht vergleichbar, wobei Gemini 2.0 eine kleine, reine Textlösung ist, die hinter Chatbots eingesetzt werden kann. Trotzdem tritt es selbstbewusst gegen Gemini 1.5 Pro an und schlägt seinen direkten Vorgänger Gemini 1.5 Flash um Längen.

Das Unternehmen hat das neue Modell Gemini 2.0 Flash einer Vielzahl von Tests unterzogen, und in fast allen Fällen konnte es sogar Gemini 1.5 Pro übertreffen. Egal, ob es um logisches Denken, Programmieren oder das Lösen von mathematischen Problemen geht, die neueste Entwicklung schnitt trotz ihrer geringen Größe sehr gut ab. Es übertraf seine Vorgänger in der Bild- und Videointerpretation und war nur in zwei Bereichen schwächer als Gemini 1.5 Pro. Der erste ist die automatische Übersetzung von Audiomaterial, der zweite die Fähigkeit, Kontexte von über 1 Million zu verarbeiten und Kurzgeschichten zu dolmetschen. In letzterem Bereich konnte es zu einiger Überraschung nicht einmal Gemini 1.5 Flash übertreffen.

Derzeit befindet sich Gemini 2.0 Flash noch in einer experimentellen Version, in die Google große Hoffnungen setzt, da es sich um eine echte Rechtschreibprüfung handelt, die hochgradig skalierbar ist, die fortschrittlichsten Technologien einsetzt und sogar mit einer sehr geringen Latenzzeit in den meisten Situationen schnelle Ergebnisse liefert.

Ein größeres Modell von Gemini 2.0 wird von Google auch in einer experimentellen Version zur Verfügung gestellt, die aber vorerst nur für Entwickler zugänglich ist. In den kommenden Monaten wird das Unternehmen versuchen, so viel Feedback wie möglich zu sammeln, um beide Produkte so gut wie möglich zu machen. Der Prototyp von Gemini 2.0 ist bereits multimodelfähig, und ein neues Multimodel Live API-Tool wird verfügbar sein, um seine Echtzeit-Sprach- und Videoverarbeitungsfunktionen in Anwendungen zu integrieren.

Das Unternehmen geht davon aus, dass Gemini 2.0 mit fortschreitender Entwicklung in immer mehr Bereichen zum Einsatz kommen wird. Zunächst wird es hinter dem Gemini-Chatbot veröffentlicht, dann im Gemini-basierten digitalen Assistenzdienst und nach und nach in anderen Google-Produkten, die die früheren Gemini LLM-Entwicklungen ersetzen. Nächstes Jahr wird Gemini 2.0 in verschiedenen Größen, sogar kleiner als Flash, eingeführt werden und die früheren Nano-Modelle ablösen.

Google hat mehrere experimentelle Projekte im Bereich der KI-Anwendungen, eines davon ist Project Astra, über das das Unternehmen erstmals auf der Google I/O sprach. Astra ist der multimodale Echtzeit-Assistent des Unternehmens für künstliche Intelligenz, der auch Gemini 2.0 erhalten wird.

Galerie öffnen

Das Unternehmen gab bekannt, dass es durch die Kombination von Project Astra mit dem neuen Sprachmodell nun in der Lage ist, die KI in die Lage zu versetzen, Gesprächen um sie herum zu folgen, selbst wenn sie Menschen hört, die in mehreren verschiedenen Sprachen gleichzeitig sprechen. Sie ist in der Lage, neben einem selektiveren Wortschatz auch Akzente und selten verwendete Wörter zu erkennen und zu verarbeiten. Es wird auch mit der Google-Suche, Maps und Lens zusammenarbeiten können. Damit könnte es zu einem nützlichen Helfer im Alltag werden.

Sie können mit dem digitalen Assistenten chatten und Project Astra, das das Modell Gemini 2.0 verwendet, hat jetzt einen besseren Speicher. Sie haben zwar immer noch die volle Kontrolle, aber in einem fortlaufenden Gespräch können Sie problemlos Informationen von vor 10 Minuten abrufen. Es wird in der Lage sein, während des Gesprächs personalisierte Antworten zu geben, aber es gibt keine Bedenken hinsichtlich der Privatsphäre. Eine weitere wichtige Änderung besteht darin, dass Astra jetzt schneller auf die Fragen der Nutzer antwortet, was das Gespräch menschlicher macht.

Galerie öffnen

Google wird die bei der Entwicklung von Project Astra gesammelten Erfahrungen nutzen, um die Qualität zu verbessern. Ziel ist es, diese Technologie schließlich in die Gemini-App zu integrieren, die für Mobiltelefone und sogar für intelligente Brillen verfügbar ist. Das Brillenformat wird von Google bereits getestet, und das Unternehmen verfügt über viel Erfahrung in diesem Bereich, die es gut nutzen könnte.

Galerie öffnen

Schließlich hat Google auch angedeutet, dass das Projekt Mariner auch das Gemini 2.0 Sprachmodell erhalten wird und in der Lage sein wird, es auf die nächste Stufe zu bringen. Im Falle von Mariner handelt es sich um eine Google Chrome-Erweiterung, die die Nutzung des Browsers in die Hände der künstlichen Intelligenz legt. Das Unternehmen hat schon einmal darüber gesprochen, damals allerdings unter dem Namen Project Jarvis . Auf der Grundlage des neuen LLM wird die generative KI in der Lage sein, bessere Ergebnisse bei der Ausführung von Befehlen zu erzielen, sie wird in der Lage sein, den Browser genauer nach den Wünschen des Nutzers zu verwalten, und in Zukunft wird sie in der Lage sein, aus dem Browser herauszutreten und den gesamten PC zu verwalten.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang