Es scheint, als wäre es erst ein paar Tage her, dass Google Veo Version 1 veröffentlicht hat…. weil es buchstäblich ein paar Tage her ist! Das Unternehmen veröffentlichte sein Videogenerierungsmodell als begrenzte Vorschau, kurz bevor OpenAI Sora veröffentlichte. Nun, Google hat gerade Veo 2 angekündigt.
Das Zeitalter der KI-Videos bricht an, da Unternehmen sowohl Modelle zur Videogenerierung als auch Streaming-Dienste mit KI-Inhalten veröffentlichen. Das letzte Beispiel bezieht sich auf TCLtv+ und die darauf vorhandenen KI-Videos. Während KI-Videos hauptsächlich in sozialen Medien existieren, sieht es so aus, als ob sie sich in weitere Bereiche der Unterhaltungsindustrie ausbreiten werden.
Nach Monaten des Wartens hat OpenAI Sora endlich für seine Benutzer freigegeben. Wenn Sie ChatGPT Plus oder höher nutzen, können Sie das Modell verwenden. Derzeit müssen sich Benutzer mit einer Vielzahl von Einschränkungen auseinandersetzen. Wenn Sie beispielsweise über ChatGPT Plus verfügen, können Ihre Videoclips bei einer Auflösung von 720p nur fünf Sekunden lang sein.
Google hat Veo 2 angekündigt
Als Google im Mai Veo 1 vorstellte, sah es bereits realistisch aus. Nun, wie bei jedem Generationswechsel sehen die Ergebnisse, die wir in Veo 2 sehen, viel besser aus. Tatsächlich sehen sie nahezu makellos aus. Google hat einige kurze Clips gezeigt, die praktisch nicht von etwas zu unterscheiden sind, das mit einer Kamera aufgenommen wurde.
Wir wissen nicht, ob es sich bei diesen Ergebnissen um Eins-zu-einer-Million-Ergebnisse handelte, die nach unzähligen unheimlichen Fehlschlägen ausgewählt wurden, oder ob das Modell einfach so gut ist. Die Ergebnisse sind viel besser als alle anderen Ergebnisse, die wir bisher gesehen haben. KI-Videos, selbst die besten, haben normalerweise einen Hinweis darauf, dass sie einem Modell entsprungen sind.
Allerdings zeigen die Ergebnisse in Veo die konsistentesten Hintergründe, Charaktere, Wasserphysik, Schatten, Haare und andere feinere Details. Es ist ziemlich beängstigend darüber nachzudenken, da Filmemacher von Sekunde zu Sekunde veralteter werden.
Es gab nur zwei Beispiele, die eine gewisse Aussagekraft hatten. Erstens hat das kleine Mädchen, das im CGI-Stil generiert wurde, den Mund nie vollständig geschlossen. Außerdem konnten wir einige seltsame Artefakte sehen, die typisch für KI-Videos um ihren Mund herum sind.
Schließlich sah das Video mit dem Flamingo EXTREM realistisch aus. Die Wasserphysik, die Reflexionen und alles andere sahen genau richtig aus. Das Einzige war, dass seine Beine vorübergehend die Plätze tauschten; sein linkes Bein wurde für ein paar Sekunden zu seinem rechten Bein.
Abgesehen davon sieht es so aus, als hätte Google das Spiel zur KI-Videogenerierung gewonnen. Das Unternehmen gibt dieses Modell für VideoFX-Benutzer frei. Das Unternehmen wird es im Laufe der Zeit auf mehr Menschen ausweiten.