OpenAI sagt, dass die öffentliche Verfügbarkeit von Sora später in diesem Jahr erfolgen wird

Oscar

OpenAI hat letzten Monat seinen bahnbrechenden Text-zu-Video-Generator Sora vorgestellt, Sora ist jedoch noch nicht öffentlich verfügbar. Derzeit befindet sich Sora in der Red-Teaming-Phase und steht nur ausgewählten Künstlern und YouTubern zur Verfügung, die das Tool testen. Für diejenigen, die es nicht kennen: Red Teaming ist der Prozess, bei dem Menschen das Tool testen, um sicherzustellen, dass es sicher und zuverlässig ist. Ziel ist es, Schwachstellen, Vorurteile und andere schädliche Probleme zu identifizieren.

In einem Interview mit dem Wall Street Journal (Paywalled) gab Mira Murati, Chief Technology Officer von OpenAI, bekannt, dass Sora „noch in diesem Jahr“ öffentlich verfügbar sein wird, mit einer möglichen Veröffentlichung innerhalb „einiger Monate“. Mit diesem Tool, Sora, können Benutzer hyperrealistische Szenen nur aus Textaufforderungen erstellen.

Sora ist umwerfend, aber noch nicht perfekt

Von Sora generierte Videos enthalten derzeit keinen Ton. Als Murati jedoch danach gefragt wurde, sagte er, dass OpenAI Pläne habe, es irgendwann irgendwann zu integrieren. Es ist vielleicht nicht Sora, aber sie haben zumindest Pläne für den Zusatz.

Ebenso wie viele Tools zur Text-zu-Bild-Generierung werden auch die Videos von Sora mit einem Wasserzeichen versehen, um Missbrauch zu verhindern. Allerdings ist ein Wasserzeichen auch keine perfekte Lösung des Problems. Dies ist ein weiterer Grund, warum das Unternehmen das Modell noch nicht der Öffentlichkeit zugänglich gemacht hat und dies Berichten zufolge auch nicht tun wird, es sei denn, sie halten es für sicher.

Auf die Frage nach den Ansichten des CTO darüber, wie sich dies auf Arbeitsplätze in der Zukunft auswirken könnte, erklärte sie, dass das Ziel nicht darin bestehe, Menschen zu ersetzen, sondern ihnen Sora als Werkzeug zur Verfügung zu stellen, mit dem sie „bearbeiten und kreieren“ könnten. Die Bearbeitung von Sora-generierten Inhalten kann erheblich sein, insbesondere angesichts der Inkonsistenzen in den Videos. Das Wall Street Journal zeigte einige von ihnen erstellte Videos und wies auf einige Unstimmigkeiten wie seltsame Hände und Finger hin.

Auf die Frage nach den Daten, die für das Training von Sora verwendet wurden, blieb Murati vage und gab an, dass das Unternehmen öffentlich verfügbare oder lizenzierte Daten verwendet habe. Während unklar bleibt, ob Videos von Plattformen wie YouTube, Facebook oder Instagram verwendet wurden, bestätigte Murati, dass Sora Inhalte von Shutterstock einbezieht, einem Partner von OpenAI.

OpenAI möchte Sora zu ähnlichen Kosten wie sein Text-zu-Bild-Modell DALL-E verfügbar machen

Murati hob einen bemerkenswerten Aspekt hervor: die höheren Kosten für die Stromversorgung von Sora im Vergleich zu früheren Modellen für künstliche Intelligenz wie DALL-E oder ChatGPT. Sie stellt fest, dass es sich bei Sora im Gegensatz zu den Text- oder Bildgenerierungsmodellen derzeit um ein Forschungsprojekt handelt, dessen Betrieb viel mehr kostet. OpenAI muss die erforderliche Computerausrüstung bereitstellen, bevor es der Öffentlichkeit zur Verfügung gestellt werden kann.

Trotz der höheren Kosten möchte OpenAI Sora der Öffentlichkeit zu „ähnlichen“ Kosten wie DALL-E zugänglich machen und legt dabei Wert auf die Zugänglichkeit seiner bahnbrechenden Technologie.