Nach der Generierung von Bildern und Videos schafft Google nun interaktive Räume mit künstlicher Intelligenz. Das Unternehmen hat eine weitere sehr aufregende Entwicklung im Rennen um die künstliche Intelligenz auf den Weg gebracht. Das Projekt Genie steckt noch in den Kinderschuhen, aber es hat es geschafft, die Investoren der Spieleentwickler zu verschrecken.
Das Team von DeepMind bei Google ist ständig auf der Suche nach neuen Herausforderungen, und Project Genie ist das Ergebnis. In diesem Fall handelt es sich um eine generative KI, die auf der Grundlage der Anweisungen und Vorgaben des Nutzers eine räumliche 3D-Umgebung erschafft, in der sich der Nutzer überall hinbewegen und springen kann. Man könnte sagen, dass auf der Grundlage der Anweisungen ein Spiel entsteht, obwohl es noch weit davon entfernt ist, wirklich wie ein PC-Spiel im klassischen Sinne zu funktionieren .
Project Genie basiert nicht auf einem völlig neuen Modell und ist derzeit nur als begrenzter vorläufiger Forschungsprototyp über Google Labs verfügbar. Allerdings gibt es bereits zahlreiche Videos auf YouTube, die sich damit befassen und sich auf die Erzeugung verschiedener interaktiver Räume konzentrieren. Das Tool basiert auf dem allgemeinen Weltmodell Genie 3, das von Forschern bei DeepMind entwickelt wurde. Wir hatten bereits die Gelegenheit, darüber zu berichten, seit es letztes Jahr vorgestellt wurde.
Ein Google-Experte teilte uns mit, dass Project Genie mit frei verfügbaren Videos aus dem Internet trainiert wurde, und dass hier der größte jemals verwendete Datensatz verwendet wurde. Laut Diego Rivas wurden "mehr als 200.000 Stunden Gameplay-Videos aus dem Internet" verwendet, um das Tool zu erlernen.
In seiner jetzigen Form wird Project Genie noch in begrenztem Umfang genutzt, aber es sieht so aus, als könnte es mehr leisten. Die strengste Einschränkung von Google besteht darin, dass sich die Nutzer im Moment nur 60 Sekunden in dem interaktiven Raum aufhalten können, der durch die Eingabeaufforderungen entsteht. Von der virtuellen Welt, die das Modell Genie 3 erschafft, ist vorerst nicht viel zu erwarten, aber man kann sich darin bewegen und das Spektakel genießen. Die KI erzeugt nicht einmal einen Ton, und Fehler treten in allen Generationen auf.
Als Google letzte Woche Project Genie vorstellte, stürzten die Aktien der Spieleentwickler in den Keller. Die Aktienkurse von Unity, Take-Two Interactive, CD Projekt, Ubisoft und anderen reagierten negativ auf das Auftauchen eines KI-Tools, das interaktive Umgebungen erstellen kann.
Im Allgemeinen gab es Kurseinbrüche von 7-10 %, von denen sich die Unternehmen in den letzten Tagen nicht mehr erholen konnten, aber es gab auch stärkere Einbrüche, wobei Unity beispielsweise ein "Massaker" von 25 % erlitt.
Project Genie wird den Spieleentwicklern sicherlich noch nicht das Brot und die Butter wegnehmen, aber es könnte Bereiche geben, in denen es in naher Zukunft einen großen Einfluss haben könnte. So deuten erste Anzeichen darauf hin, dass es den Entwicklern, die sich mit der Erstellung und Umsetzung von Konzepten befassen, in den kommenden Jahren die Arbeit abnehmen könnte. Solche und ähnliche Instrumente könnten in Unternehmen, die sich bereits auf einem holprigen Weg befinden, weitere Kürzungen auslösen.
Es sollte auch gesehen werden, dass neben Google auch andere Unternehmen an einem solchen Instrument arbeiten. Elon Musk zum Beispiel hat bereits öffentlich über die Arbeit von xAI an einem Tool zur Erstellung von "qualitativ hochwertigen Darbietungen und Spielen in Echtzeit" gesprochen, "die die Menschen an ihre eigenen Bedürfnisse anpassen können". xAI hofft, dieses Tool im Jahr 2027 auf den Markt bringen zu können. Und Mark Zuckerberg hat gesagt, dass KI-Tools Spiele in Zukunft "interaktiver und immersiver" machen werden. Auch Meta arbeitet an einem Tool für die Spieleentwicklung.
Tim Sweeney gab nach dem Start von Project Genie ebenfalls eine Erklärung ab. Der CEO von Epic Games sagte kürzlich, dass "wir ein ständiges Nebeneinander von KI, die sich auf die Spiel-Engine konzentriert, und KI, die sich auf das Weltmodell konzentriert, sehen werden". Das Endergebnis werde sein, dass "die beiden Ansätze verschmelzen, um maximale Effektivität zu erreichen".