ShengShu Technology führt Vidu 2.0 ein, für schnellere Videogenerierungsgeschwindigkeit und geringere Kosten

ShengShu Technology betrat die Szene mit Neuheiten wie Multiple-Entity Consistency und der ersten kommerziell erhältlichen generativen Videoplattform, Vidu. Und das Unternehmen gab heute bekannt, dass es ihm gelungen ist, in den ersten 100 Tagen 10 Millionen Nutzer zu gewinnen. Aber es ist noch früh und zahlreiche branchenweite Probleme sind für Verbesserungen vorgesehen. Dazu zählen vor allem Geschwindigkeit und Erschwinglichkeit.

Jedes Mal, wenn ein Video erstellt wird, dauert es Dutzende Sekunden oder sogar Minuten. Generatives Video in seinem aktuellen Format eignet sich heute vielleicht hervorragend für die Erstellung von Filmmaterial für Redakteure oder für soziale Inhalte, doch die meisten Unternehmen betrachten Geschwindigkeit mittlerweile als eine neue Büchse der Pandora für Anwendungen, die ohne Verbesserungen bei Geschwindigkeit und Kosten nicht möglich sind. Dies gilt für die programmatische Werbebranche, die größtenteils automatisiert ist, und sogar für neue Methoden des Storytellings.

Das Unternehmen stellt sich beispielsweise eine Welt vor, in der generative Videos zur Veranschaulichung einer Geschichte verwendet werden können. Aber diese Geschichte ist interaktiv und passt sich jeder Entscheidung an, die Sie treffen, wie Bandersnatch von Netflix, aber mit praktisch unbegrenzten Enden. Wenn Sie vielleicht neugierig wären, was passieren würde, wenn Harry schließlich nach Slytherin eingeteilt würde und die Chance hätte, die Entscheidung des Sprechenden Hutes zu „beeinflussen“, könnten generative Videos dies in Zukunft vielleicht ermöglichen. Doch damit das gelingt, kommt es auf Schnelligkeit an.

Hier kommt die Vidu 2.0-Technologie von ShengShu Technology ins Spiel. Es handelt sich um ein großes Update, das wohl einen Meilenstein für die Branche darstellt. Der Schwerpunkt von Vidu 2.0 liegt auf schnelleren Ausgaben, aber zu wesentlich geringeren Kosten für die Erstellung jedes Videoclips, was laut Vidu 2.0 dank seiner bahnbrechenden Technologie, die es als „Full-Stack-Interferenzbeschleuniger“ bezeichnet, möglich ist.

„Vidu 2.0 bietet ultraschnelle Generierungsgeschwindigkeiten, robuste multimodale Kontextverarbeitung zu einem günstigeren Preis und ist einfacher als je zuvor zu verwenden. Noch wichtiger ist, dass dies die Eckpfeiler sind, die die gemeinsame Erstellung von Echtzeitinhalten durch Benutzer oder Unternehmen ermöglichen und es ihnen ermöglichen, in ihr Publikum einzutauchen und sich besser mit ihm zu verbinden“, sagte Jiayu Tang, CEO und Mitbegründer von ShengShu Technology.

Zugegebenermaßen generiert Vidu 2.0 Videos nicht sofort, aber das Unternehmen ist im Vergleich zur Konkurrenz führend, da es die Zeit, die zum Erstellen von Clips benötigt wird, auf unter 10 Sekunden verkürzt. Und das zu Kosten, die 55 % unter dem Branchendurchschnitt liegen.

Um etwas Licht in diese Benchmarks zu bringen, erklärt ShengShu Technology, dass die Branchendurchschnittskosten für die Erstellung eines Clips 0,084 US-Dollar pro Sekunde betragen. Vidu 2.0 hat es jedoch geschafft, diesen Wert um satte 55 % auf nur 0,0375 $ pro Sekunde zu senken. Besser noch: Man könnte meinen, dass die Qualität des Videos sinken würde, wenn es schneller wäre, aber Vidu 2.0 sorgt dafür, dass das nicht passiert.

Als Teil der Vision hinter dem Vidu 2.0-Update stellt sich ShengShu Technology eine Zukunft vor, in der Textaufforderungen – von denen einige mit eigenen Komplikationen und Know-how für die perfekte Ausgabe verbunden sind – irgendwann der Generierung von Clips mit nur einem Klick weichen könnten. Dadurch entfällt das Rätselraten beim Versuch, komplexe Eingabeaufforderungen durch Ausprobieren zu generieren.

Der Ansatz von Vidu 2.0 hierfür besteht in einer „Vorlagen“-Funktion, aus der Benutzer aus einer Reihe voreingestellter Eingabeaufforderungsvorlagen auswählen können. Vorlagen machen das Hinzufügen interaktiver Requisiten oder komplexer Aktionen – wie zum Beispiel der Versuch, zwei bestimmte Personen aus einer Fünfermenge dazu zu bringen, einander die Hand zu geben – erheblich einfacher.