Neben Gemini entwickelt Google auch kontinuierlich die Gemma-Sprachmodelle weiter, die interessant sind, weil sie "quelloffen" sind und mehr Freiheit bei der Anpassung und Optimierung bieten. Das neue Gemma 4 12B kann lokal auf einem Laptop ausgeführt werden und ist dabei fast genauso leistungsfähig wie die Gemma-Variante mit mehr als der doppelten Anzahl an Parametern.
Der Gemma E4B und der Gemma 4 12B, der für den Einsatz in einer bescheideneren Umgebung gedacht ist und zwischen dem Gemma 4 26B mit seiner fortschrittlichen Mixture of Experts (MoE)-Architektur angesiedelt ist, bieten laut Google leistungsstarke Funktionen bei deutlich reduziertem Speicherbedarf.
Das Gemma 4 12B ist Googles erstes offenes Modell im mittleren Preissegment mit nativer Audioverarbeitungsfunktion.
Das DeepMind-Entwicklungsteam hat für die Erstellung des Sprachmodells eine neuartige, einheitliche Architektur verwendet, was bedeutet, dass keine multimodalen Kodierer arbeiten, um sicherzustellen, dass Inhalte in verschiedenen Formaten auf einheitliche Weise verarbeitet werden. In diesem Fall sind die visuelle und die Audioverarbeitung direkt mit dem Backbone des LLM-Tools verbunden, heißt es in dem Bericht.
Mit ihren extrem fortschrittlichen Argumentationsfähigkeiten ist die Gemma 4 12B der früheren Gemma 4-Variante, die mit dem Parametersatz 26B arbeitet, buchstäblich auf den Fersen. Mehr noch, in besonderen Situationen kann sie ihm sogar voraus sein. Der neue Ansatz der Konstrukteure macht das Modell in hohem Maße fähig, mehrstufige Arbeitsabläufe zu bewältigen und damit Agentenaufgaben vorbildlich zu erfüllen.
Google ist stolz darauf, dass es seinen Forschern und Ingenieuren gelungen ist, die Gemma 4 12B für den Einsatz in der Praxis fit zu machen. Ein Laptop sei ausreichend, so das Unternehmen. Es sollte jedoch hinzugefügt werden, dass hier die leistungsstärksten Laptops auf dem Markt in Betracht gezogen werden sollten, da 16 GB VRAM (oder Unified Memory) erforderlich sind. Ein weiterer interessanter Aspekt des Modells ist, dass es MTP (Multi-Token Prediction) verwendet, wodurch es effizienter und schneller reagieren kann.
Das Gemma 4 12B-Modell hat im beliebten GPQA Diamond-Benchmark bereits eine Punktzahl von 78,8 Prozent erreicht und liegt damit etwa gleichauf mit den Modellen Claude Sonnet 4.5 und GPT-5.4 nano. Und im Test MMMU Pro advanced multimodal artificial intelligence erreichte es 69,1 %, was ebenfalls dem Niveau des Claude Sonnet 4.5 entspricht und das GPT-5.4 nano (65 %) deutlich übertrifft.
Laut Google wurden die Gemma-4-Modelle dank des großen Interesses von Entwicklergruppen seit ihrer Veröffentlichung bereits mehr als 150 Millionen Mal heruntergeladen. Und die Einsatzmöglichkeiten könnten nicht vielfältiger sein: Sie wurden für den Bau von Roboterarmen verwendet, die verletzten Menschen helfen, und dienen als Grundlage für KI-Sicherheitssysteme auf Unternehmensebene.
Der Gemma 4 12B, der jetzt auf den Markt kommt, wird die Modellpalette noch weiter ausbauen. Google erwartet, dass sich Entwickler darauf konzentrieren werden, die Verzweigungsfähigkeiten der neuen Ergänzung zu nutzen.