Runway, ein weiteres KI-Unternehmen, das die Tech-Branche durchforstet, verfügt über ein leistungsstarkes Videogenerierungsmodell namens Gen-3 Alpha. Obwohl es leistungsstark ist, sind einige Leute nicht glücklich darüber, wie das Unternehmen Videos zum Trainieren erhalten hat. Einem neuen Bericht zufolge hat Runway möglicherweise eine Menge Videos raubkopiert, um sein KI-Modell zu trainieren, darunter auch YouTube-Videos.
Stellen wir uns nicht dumm; so ziemlich jedes Medienelement, das wir im Internet sehen, wurde wahrscheinlich ausgelesen und zum Trainieren eines KI-Modells verwendet. Dazu gehören Artikel, Bücher, Social-Media-Beiträge, Bilder, Podcasts, Videos usw. Unternehmen kratzen all diese Inhalte direkt vor unserer Nase und niemand weiß davon, bis Geschichten wie diese an die Oberfläche kommen. Es ist ziemlich traurig.
Vor ein paar Monaten gab es ein bisschen Drama darüber, ob OpenAI YouTube-Daten ausspioniert hat, um Sora, sein Tool zur Videogenerierung, zu trainieren. Das zeigt nur, dass YouTube und Google es nicht dulden, dass Unternehmen Daten von YouTube ausspionieren. Seitdem ist der Streit verstummt.
Runway hat möglicherweise Videos raubkopiert, um sein KI-Modell zu trainieren
Das Modell von Runway ist beeindruckend, aber es bräuchte eine Menge Videodaten, um es zu trainieren. Diese Videodaten müssen ja irgendwo herkommen, und 404 Media hat enthüllt, woher diese Daten stammen könnten. Das Unternehmen hat eine Tabelle mit Links zu einer Menge YouTube-Kanälen gefunden. Zu diesen Kanälen gehören Mr. Beast, MKBHD, The Try Guys, Nintendo, BuzzFeed, Netflix, Linus Tech Tips, Sam Kolder und viele mehr.
Runway hat nicht bei YouTube aufgehört. Die Tabelle enthält auch Links zu Websites wie KissCartoon, einer Piraterie-Website. Insgesamt enthält die Tabelle fast 4.000 Links. Jede Zeile in der Tabelle enthält Informationen über die YouTube-Kanäle, wie die Anzahl der Videos und die Inhalte, die sie erstellen.
Berichten zufolge verwendete das Unternehmen einen Crawler, um diese Videos herunterzuladen und in das Modell einzuspeisen. Als ob das nicht schon schlimm genug wäre, verwendete Runway angeblich einen Proxy, um nicht von Google entdeckt zu werden. Das Unternehmen wusste also, dass Google verärgert sein würde, wenn es Videodaten ausspionierte.
Wir sind nicht sicher, wie viele der Daten in der Tabelle tatsächlich zum Trainieren des Modells verwendet wurden. Leider werden wir es vielleicht nie erfahren.
Die rechtlichen Konsequenzen
Dies könnte schwerwiegende rechtliche Konsequenzen haben. Unternehmen wie Microsoft und OpenAI werden bereits vor Gericht gezerrt, weil sie Daten der New York Times gescrapt haben. YouTube könnte je nachdem, wie viele Rohvideodaten das Unternehmen gescrapt hat, eine rechtliche Grundlage haben, um Runway zu verklagen.
Außerdem enthalten die YouTube-Kanäle auf der Liste Kanäle einiger ziemlich großer Unternehmen wie Disney, Netflix und Nintendo. Wir sind sicher, dass diese Unternehmen einige urheberrechtlich geschützte Videos auf ihren Kanälen haben. Die Geschichte hat uns gelehrt, dass man, wenn man sich mit Nintendo anlegt, nur um eine Klage bettelt.
Schließlich dürfen wir nicht übersehen, dass möglicherweise Videos von einer Piraten-Website heruntergeladen wurden. Wenn das zutrifft, handelt es sich um einen direkten Verstoß gegen das Gesetz.
Da diese Informationen nun öffentlich sind, müssen wir einfach abwarten, was mit dem Unternehmen und seinem Videomodell passiert.