Reporter verklagt KI-Unternehmen, weil sie Chatbots mit urheberrechtlich geschützten Büchern trainieren

Eine Gruppe US-Reporter hat mehrere führende Unternehmen für künstliche Intelligenz verklagt, darunter OpenAI, Google, Elon Musks xAI, Anthropic, Meta Platforms und Perplexity. Der Grund dafür ist angeblich die Nutzung urheberrechtlich geschützter Bücher ohne Zustimmung zum Training ihrer KI-Systeme. Die Kläger, darunter der New-York-Times-Reporter John Carreyrou, reichten die Klage am Montag ein.

John Carreyrou, der Reporter der New York Times und Autor von „Bad Blood“, reichte die Klage zusammen mit fünf anderen Autoren beim kalifornischen Bundesgericht ein. Sie werfen den KI-Unternehmen vor, ihre geschützten literarischen Werke zu raubkopieren, um ihre großen Sprachmodelle (LLMs) zu entwickeln, die die KI-Chatbots der Unternehmen antreiben. Die Unternehmen haben sich keine Lizenzen gesichert oder die Autoren entschädigt.

„In diesem Fall handelt es sich um einen einfachen und vorsätzlichen Diebstahl, der eine Urheberrechtsverletzung darstellt„, heißt es in der Akte. Dies ist einer von mehreren Urheberrechtsklagen von Autoren und anderen Urheberrechtsinhabern gegen die Technologieunternehmen. Allerdings ist dieser Fall offenbar der erste, in dem xAI als Beklagter genannt wird.

Die Autoren werfen KI-Unternehmen vor, urheberrechtlich geschützte Bücher zum Trainieren von KI-Systemen verwendet zu haben

Den Petenten zufolge haben die KI-Unternehmen über Schattenbibliotheken, darunter LibGen, Z-Library und OceanofPDF, auf Raubkopien von Büchern zugegriffen. Diese Kopien wurden angeblich in KI-Systeme eingebettet, um deren Entwicklung zu beschleunigen. In der Klage wurde behauptet, dass der mutmaßliche Verstoß Hunderte von Autoren betraf, darunter Bestsellerautoren und mit dem Pulitzer-Preis ausgezeichnete Journalisten.

Im Gegensatz zu anderen anhängigen Fällen verfolgen die Autoren in diesem Fall keine Sammelklage. Hierbei handelt es sich um eine Art von Klage, die den Beklagten Vorteile bietet, indem sie ihnen ermöglicht, einen einzigen Vergleich auszuhandeln. Stattdessen möchte es, dass einzelne Ansprüche von einer Jury beurteilt werden.

„LLM-Unternehmen sollten nicht so einfach in der Lage sein, Tausende und Abertausende hochwertige Forderungen zu Schnäppchenpreisen auszulöschen„, heißt es in der Beschwerde. Die Kläger argumentieren, dass die bestehenden Sammelklagen das Ausmaß des mutmaßlichen Verstoßes nicht wirklich widerspiegeln.

Autoren verfolgen in diesem Fall keine Sammelklage

Zuvor hatte Anthropic im August die erste größere Einigung in einem Urheberrechtsfall im Bereich KI-Training erzielt. Es erklärte sich bereit, 1,5 Milliarden US-Dollar an Autoren zu zahlen, die behaupteten, das Unternehmen habe Millionen von Büchern raubkopiert. In der neuen Klage wird davon ausgegangen, dass die Sammelkläger in diesem Fall nur 2 % erhalten, was sie als „einen winzigen Bruchteil“ der gesetzlichen Obergrenze des Urheberrechtsgesetzes von 150.000 US-Dollar pro verletztem Werk bezeichnet.

Unterdessen argumentieren KI-Firmen, dass die Verwendung von urheberrechtlich geschütztem Material zum Trainieren von KI-Modellen als faire Nutzung zu qualifizieren sei. Dies liegt daran, dass Systeme neue und transformative Ergebnisse generieren, anstatt Originalwerke zu reproduzieren. Ein US-Richter befand in einem früheren Fall, dass die Nutzung urheberrechtlich geschützter Bücher durch Anthropic für die KI-Schulung einer fairen Nutzung gleichkäme. Es entschied jedoch, dass das Unternehmen gegen das Urheberrecht verstoßen habe, indem es Millionen von Raubkopien von Büchern in einer zentralen Datenbank gespeichert habe. Dies gilt unabhängig davon, ob sie zum Trainieren von KI verwendet wurden.