Neue KI-Videosoftware Veo 3

Ein Gamechanger für die Medienlandschaft

Still aus einem mit Veo 3 generierten Videos eines Seemanns
Foto: Courtesy Google

Still aus einem mit Veo 3 generierten Video eines Seemanns

Was, wenn man mit einem Satz ganze Filmszenen erzeugen könnte – samt Soundtrack, Schauspiel und Spezialeffekten? Genau das verspricht Googles neue KI Veo 3. Die Begeisterung ist groß, doch auch die Kritik: Ist das noch Innovation – oder wieder nur gut kopiert?

Bislang haben wir uns bei der Generierung von Medien mit KI auf jeweils eine Disziplin fokussiert. Musik hat ihre eigene KI-Plattform (Udio), genauso wie Text (ChatGPT), Bilder (Midjourney) und Videos (Sora). Der eigentliche Wunsch besteht jedoch bei vielen darin, mit einem Textbefehl multimediale, vertonte Sequenzen, wenn nicht ganze Filme, zu prompten. 

Googles neue Version der Video-KI Veo 3 kann genau das und sorgt seit Tagen für Erstaunen, Begeisterung und (wie so oft, wenn ein nächster Evolutionsschritt getan wurde) Unruhe in der Kunst- und Medienwelt. Ab nun können nämlich mithilfe eines einfachen Befehls Videos erstellt werden, die mit Sprache, Mimik, Gestik, Dialogen, Soundeffekten und passender Musik ausgestattet werden. 

Ob Hollywood-Blockbuster, Game-Szenen oder virale Meme-Videos – kein Stil, kein Genre scheint unmöglich. Woran man auch wieder erkennt, wo das Trainingsmaterial für die Modelle eigentlich herkommt, nämlich ungefragt von überall. Dabei braucht Veo 3 gar keine komplexen Prompts, um zu guten Ergebnissen zu kommen.

Das Tempo von Software wie Veo 3 bleibt irre

Noch ist der Service einer recht überschaubaren Community vorbehalten. Um Veo 3 auszuprobieren, braucht man das Abo "Gemini Ultra", das 250 Dollar im Monat kostet und zunächst ohnehin nur Usern in den USA zur Verfügung steht. Auch sind die Credits limitiert, und das Experimentieren kann schnell ins Geld gehen. 

Binnen weniger Tage sind dennoch viele interessante Videos entstanden, die das Potenzial, aber auch die Lücken dieser Technologie erkennen lässt. Aber lassen wir uns nicht täuschen. Das Tempo, in dem die Fortschritte gemacht werden, bleibt irre. Vor gerade mal zwei Jahren war dieser Nudeln mampfende Will Smith noch die Krone der Schöpfung im Bereich KI und Film.



Schauen wir uns ein paar aktuelle Beispiele an. Dieses Video zeigt unterschiedliche Szenen, in denen Menschen Gespräche führen. Allesamt mit Veo 3 geschrieben. Von 80er-Jahre-Sitcoms bis zu modernen Film-Stilen scheint alles machbar – auch Songs und Tanzchoreografien können inszeniert werden. 

Vor allem imponieren die Shots von der Messe. Wenn man nicht weiß, dass so etwas KI-generiert ist, wird es zunehmend schwerer, Authentisches und Gefaktes zu unterscheiden. Die Details sind ziemlich akkurat, und auch die Kameraführung fühlt sich je nach Genre authentisch an. Auffällig sind die Gesichtsausdrücke der Charaktere, wenn sie sich aufregen oder empören. Da hat offenbar jemand zu viel von der MDMA-Bowle genascht. 



Machen wir weiter mit einer Szene aus einem Action-/Kriegsfilm. Hier stürmt ein SWAT-Team ein feindliches Lager und, von den Soundeffekten und Animationen abgesehen, ist vor allem interessant, wie gut und passend die Musik sich der Dramatik anpasst. 

Ja, einfach als wäre das schon eine Produktion eines richtigen Studios. Szenen, die sonst sehr viel Geld kosten würden, auch im Zeitalter von CGI, sind nun genauso schnell gemacht wie die Suche nach einem Kuchenrezept im Internet. 



Als letztes Beispiel noch mein heimlicher Favorit. "Plastic" ist eine Art Kurzfilm über den Jungen Bob, mit mehreren Erzählebenen und Plottwists. Eine weirde Mischung aus Blockbuster, viralem Content und schrägem Humor. Überzeugen Sie sich selbst: 

 



Aktuell füllen sich YouTube, Reddit und Instagram mit neuen Kreationen mit Veo 3, und es könnte in der Tat ein Gamechanger sein, was die Medienproduktion anbetrifft. Eben, weil es Sound, Film, Musik und Sprache synchronisiert und viele Szenen schon relativ geschmeidig wirken. 

Was für eine Macht das aber ist, als Einzelperson so etwas erschaffen zu können, das muss zumindest ich erstmal sacken lassen. Da geht es um weit mehr, als seine Lieblingsbücher von der KI verfilmen zu lassen.