Gemini Omni: Googles neues KI-Modell macht Video-Erstellung per Sprache möglich

Google hat mit Gemini Omni Flash das erste Modell einer neuen Modellfamilie vorgestellt – und es markiert einen deutlichen Sprung in der KI-gestützten Videogenerierung.

Gemini Omni vereint erstmals Googles Schlussfolgerungsfähigkeiten mit echter kreativer Ausgabe. Das Modell versteht Eingaben in Form von Text, Bild, Audio und Video – und erzeugt daraus hochwertige Videos. Besonders neu: Videos lassen sich per natürlicher Sprache bearbeiten, wobei jede Anweisung auf der vorherigen aufbaut.

Videos einfach per Spracheingabe bearbeiten

Mit Omni kann man ein bestehendes Video nehmen und es durch einfache Prompts verändern – neue Charaktere einfügen, den Stil wechseln, die Umgebung tauschen oder physikalische Effekte hinzufügen. Charaktere bleiben dabei konsistent, Szenen behalten ihren Zusammenhang. Mehrere Bearbeitungsschritte hintereinander sind möglich, ohne den roten Faden zu verlieren.

Allgemeinwissen trifft Kreativität

Omni greift auf Geminis breites Weltwissen zurück: Das Modell versteht Physik, kennt historische und kulturelle Kontexte und kann damit nicht nur visuelle Effekte, sondern auch inhaltlich sinnvolle Videos erzeugen – etwa Erklärvideos aus kurzen Prompts oder Szenen mit realistischer Dynamik wie Schwerkraft oder Fluiddynamik.

Alle Medientypen als Eingabe kombinierbar

Bilder, Videos, Audiodateien und Text lassen sich gemeinsam als Referenz nutzen. Das Modell erstellt daraus ein stimmiges Ergebnis. Zeichnungen können in realistische Footage umgewandelt, Stile aus Referenzvideos übertragen oder Bewegungen auf neue Figuren angewendet werden.

Sicherheit und Transparenz

Alle mit Omni erzeugten Videos enthalten das unsichtbare Wasserzeichen SynthID, das eine Überprüfung der KI-Herkunft erlaubt. Eine Avatar-Funktion ermöglicht es, Videos mit dem eigenen digitalen Abbild zu erstellen – diese Funktion ist in Europa vorerst nicht verfügbar.

Verfügbarkeit

Gemini Omni Flash ist ab sofort für Abonnenten von Google AI Plus, Pro und Ultra über die Gemini App und Google Flow zugänglich. Für Nutzer von YouTube Shorts und YouTube Create ist es kostenlos verfügbar. Die API für Entwickler folgt in den kommenden Wochen.

Quelle: Google Blog, 19. Mai 2026