Der COO von OpenAI weigerte sich zu antworten, ob Sora auf YouTube-Videos geschult ist

Oscar

Das Text-zu-Video-Modell Sora von OpenAI ist je nach Perspektive sowohl beeindruckend als auch beängstigend. Es kann Ihnen helfen, Ihre Ideen in einen Videoclip umzusetzen, ohne dass Sie eine Kamera benötigen. Aber es kann auch diese Jobs übernehmen. Für Unbekannte: Das Modell der künstlichen Intelligenz generiert bis zu minutenlange Videoclips auf Basis einfacher Textbeschreibungen.

Das von Microsoft unterstützte Startup hat gerade das erste große Musikvideo veröffentlicht, das von Sora erstellt wurde. Wichtig ist, dass sich das Modell noch in der Testphase befindet und noch nicht für die Öffentlichkeit verfügbar ist. Es gibt also in verschiedenen Aspekten noch Raum für Verbesserungen.

Hat OpenAI Sora auf YouTube-Videos trainiert?

Letzten Monat hat der CEO von YouTube OpenAI bereits davor gewarnt, seine Videos zum Trainieren von Sora zu verwenden. In einem neueren Interview auf dem Bloomberg Technology Summit sprach COO Brad Lightcap über mögliche Geschäftsanwendungen seiner KI-Produkte. Sora, eines der bemerkenswerten Produkte des Startups mit potenziellen Geschäftsanwendungen, erschien ebenfalls im Gespräch. In Bezug auf Sora stellte der Interviewer die Frage: „Welche Trainingsdaten wurden zum Trainieren des Modells verwendet?“

Genauer gesagt drängte der Interviewer den OpenAI-Beamten, definitiv zu klären, ob sie Sora anhand von YouTube-Videos trainiert hätten. Lightcap schien jedoch nicht bereit zu sein, eine direkte Antwort zu geben. Stattdessen erörterte er verschiedene Aspekte, darunter die Erstellung von Inhalten, die Nutzung dieser Inhalte als Daten für das Modelltraining, die Gewährleistung von Transparenz hinsichtlich der Datennutzung, potenzielle Vorteile für Inhaltsersteller und mehr. Allerdings erwähnte er YouTube kein einziges Mal in seiner beschreibenden „Nicht-Antwort“ auf die Frage, ob OpenAI Sora auf Videos von der Plattform trainiert hat oder nicht.

COO Brad Lightcap weigerte sich, die Frage zu beantworten

„Also ja, wir beschäftigen uns mit diesem Problem, es ist wirklich schwierig. Wir haben noch nicht alle Antworten“, schloss er. OpenAI hat tatsächlich einige Informationen zum Thema „Verstehen der Quelle dessen, was wir online sehen und hören“ weitergegeben. Es ging jedoch hauptsächlich um die Authentizität der Inhalte und darum, wie sie die Transparenz über die Quelle der Inhalte aufrechterhalten wollen. In dem Beitrag wurde jedoch nicht wirklich darüber gesprochen, welche Daten sie zum Trainieren der Sprachmodelle verwendet haben oder verwenden. Ganz zu schweigen davon, dass auch nicht über die Verwendung von Inhalten von YouTube gesprochen wurde.

Zur Erinnerung: Der CTO des Unternehmens, Mira Murati, wurde Anfang letzten Monats die gleiche Frage zu Sora gestellt. Auch sie konnte auf die Frage keine eindeutige Antwort geben.

Berichten von Anfang des Jahres zufolge nutzte OpenAI YouTube-Videos, um GPT-4 zu trainieren, was gegen die Plattformregeln verstößt. Berichten zufolge hat Google jedoch dasselbe getan. Apropos Soras Trainingsdaten: Die komplizierte Nichtbeantwortung deutet auf die Möglichkeit der Verwendung von YouTube-Videos hin. Das Modell könnte in der zweiten Hälfte des Jahres 2024, möglicherweise im August, der Öffentlichkeit zugänglich gemacht werden.