Kategorien

OPENAI STARTET KI-DIENST ZUR VIDEOGENERIERUNG

Die neueste Entwicklung des Unternehmens heißt Sora und ist eine große Herausforderung für die Konkurrenz.
DemonDani
DemonDani
OpenAI startet KI-Dienst zur Videogenerierung

Text-zu-Text-Modelle sind die einfachsten generativen KI-Lösungen, und Text-zu-Bild-Modelle bereiten den Entwicklern keine großen Kopfschmerzen mehr. Immer mehr Unternehmen bieten solche Entwicklungen in verschiedenen Formen an. Text-zu-Video ist jedoch eine ganz andere Ebene, aber OpenAI befasst sich bereits mit diesem Thema.

Einfachere Text-zu-Video-KI-Dienste gibt es schon seit einiger Zeit, aber es gibt keine Lösung, die wirklich gut funktioniert und für ein breites Publikum zugänglich ist. Die meisten dieser generativen KIs können zwar mit der Bewegung von Objekten in Bildern umgehen, aber sie können z. B. die Physik nicht naturgetreu darstellen. OpenAI sagt, dass Sora im Allgemeinen damit umgehen kann, obwohl es immer noch Fehler machen kann.

"Sora kann aus einfachen Textanweisungen realistische und phantasievolle Szenen erstellen", so das Unternehmen.

Die Neuheit kann Videos von bis zu 60 Sekunden - oder 1 Minute, wenn Sie es vorziehen - erstellen, was in dieser Hinsicht bereits eine gute Leistung ist. Die meisten dieser generativen KI-Modelle sind nur wenige Sekunden von einer Mindestbildrate entfernt. Stable Video Diffusion zum Beispiel begann mit nur 25 kontinuierlichen Bildern, während Googles experimentelles Lumiere 80 Bilder schafft.

Sora wird derzeit vom "Red Team" untersucht, das herauszufinden versucht, wie der Dienst missbraucht werden kann. OpenAI kann dies nutzen, um das System einzuschränken, damit es in möglichst sicherer Form eingesetzt werden kann. Selbst eine bild- oder stimmgenerierende KI birgt ein großes Risiko, und das Gleiche gilt für einen videogenerierenden Dienst.

Parallel dazu hat OpenAI das Tool bereits einigen Künstlern, Designern und Filmemachern zur Verfügung gestellt, um auch an dieser Front Feedback zu erhalten. Schließlich möchte das Unternehmen Videofilmern die Möglichkeit geben, Sora zu nutzen, Animationen für verschiedene Szenen zu erstellen oder einfach nur Inspiration für Aufnahmen zu erhalten. In der kommenden Zeit wird sich Sora weiter entwickeln, vorerst noch am Anfang seiner Entwicklung, wie DALL-E 2021.

Übrigens hat OpenAI kürzlich auch eine wichtige Ankündigung zu DALL-E 3 gemacht. Das Unternehmen sagte, dass es auch ein neues Wasserzeichen einführen wird, um durch künstliche Intelligenz manipulierte Bilder zu erkennen. Es hat dies im Einklang mit den Richtlinien der C2PA-Gruppe getan, die bereits eine Erwartung der US-Regierung für den sauberen Einsatz von KI ist.

Galerie öffnen

Die Beziehung zwischen OpenAI und der Regierung ist nicht die beste, und das war in diesem Fall offensichtlich. In der Tat fügte das Unternehmen hinzu, dass das Wasserzeichen, das viele Menschen erwarten, in Wirklichkeit nicht unentfernbar ist. Es kann sogar versehentlich bei Online-Uploads und -Sharing verloren gehen, während visuelle Wasserzeichen auf Bildern in Sekundenschnelle abgeschnitten werden können. Das Unternehmen hofft jedoch, dass es in Zukunft weniger Missbrauch geben wird und dass alle diese neue Art der Verwaltung von Metadaten unterstützen werden.

Wir empfehlen Ihnen gerne

    Teste

      Diesbezügliche Artikel

      Zurück zum Seitenanfang