META Berichten zufolge torrentierte 82 TB von urheberrechtlich geschützten Büchern für KI -Training

Oscar

Die Muttergesellschaft von Facebook befindet sich nach einer Klage, die von einer Gruppe von Autoren eingereicht wurde, in der Mitte eines potenziellen rechtlichen Durcheinanders. Die Klage beschuldigt Meta, urheberrechtlich geschütztes Material ohne Erlaubnis zur Entwicklung von AI -Produkten zu verwenden. In einem neuen Update soll Meta bis zu 82 TB Inhalte für KI -Schulungen torrentiert haben.

Die „neue“ Klage gegen Meta entstand Mitte Januar 2025. Es ist tatsächlich eine Follow-up zu einer Klage, die ursprünglich im Jahr 2023 eingereicht wurde, die bereits abgewiesen worden war. Die Kläger behaupteten, Meta verwendete illegal Inhalte aus Büchern, um seine Lama -KI -Modelle auszubilden. Zu diesem Zeitpunkt wurde die Menge an urheberrechtlich geschützten Inhalten von der Firma auf 32 TB geschätzt. Die Daten wurden Berichten zufolge von Libgen erhalten, einem Datensatz, der für eine Weile im Internet verfügbar war und Inhalte aus Büchern aller Art enthielt – von der Komödie bis zur Wissenschaft.

Die Größe der Datensätze Berichten zufolge erreicht Meta für das AI -Training 82 TB

Die neuesten Aktualisierungen des Falls zeigen jedoch, dass Meta möglicherweise eine viel größere Datenmenge verwendet hat. Neben Libgen hat Meta Berichten zufolge Annas Archiv- und Z-Bibliotheks-Datensätze verwendet. Insgesamt erwähnt das Dokument, dass Meta tatsächlich etwa 82 TB Dateien für das KI -Training torrentiert hat.

Die in dem Fall vorgelegten Beweise zeigen die mutmaßlichen Bedenken, die von Mitarbeitern, die am Projekt von Meta beteiligt sind, geäußert wurden. “Ich glaube nicht, dass wir Raubmaterial verwenden sollten. Ich muss hier wirklich eine Linie ziehen„Ein hochrangiger KI -Forscher sagte Berichten zufolge im Jahr 2022.“Die Verwendung von Raubkopien sollte über unsere ethische Schwelle liegen„Ein anderer Forscher sagte Berichten zufolge. “Scihub, ResearchGate, Libgen sind im Grunde genommen wie Piratebay oder so, sie verteilen Inhalte, die durch das Urheberrecht geschützt sind, und sie verletzen ihn«, Fügten sie hinzu.

Die ursprüngliche Beschwerde behauptet auch, Mark Zuckerberg habe sich über den Ursprung der Datensätze bewusst. In einem Treffen im Jahr 2023 hat der CEO von Meta jedoch ihre Verwendung angeblich deren Verwendung genehmigt. “Wir müssen dieses Zeug nach vorne bewegen … wir müssen einen Weg finden, um all das zu entsperren“Sagte Zuckerberg angeblich. “Torrenting von einem Firmenlaptop fühlt sich nicht richtig an (lacht laut Emoji),Ein Meta -Mitarbeiter hat einen anderen in einem Gespräch erzählt.

Meta hätte versuchen können, zu vermeiden, Spuren von Downloads zu hinterlassen

Die Dokumente behaupten sogar, dass Meta Schritte unternahm, um seine Schritte zu verbergen. Das Unternehmen versuchte Berichten zufolge zu verhindern, dass Traces hinterlassen wird, die die Verfolgung von Datensatzaktivitäten auf seine Server ermöglichen. Dies impliziert, dass Meta möglicherweise versucht hat, Urheberrechtsgesetze zu vermeiden.

Es scheint nicht so, als würde der Fall bald eine Lösung haben. Die ersten Entscheidungen in dieser Angelegenheit werden innerhalb von Monaten erwartet. Wenn die Ausgabe für Meta negativ ist, werden sie sicherlich ansprechen, was den Prozess weiter verlängern wird. Es ist möglich, dass wir am Ende erst in Jahren ein endgültiges Urteil für diesen Fall haben werden. Diese Klage – und andere – ist ein Beispiel dafür, wie das Urheberrecht für das KI -Training Jahre später in einer „Grauzone“ bleibt.