„Wir sollten nicht zahlen“: Google verteidigt die Verwendung kostenloser Webinhalte für KI-Schulungen

Oscar

Von Beginn des KI-Booms an war eine Debatte allgegenwärtig: der Besitz von Inhalten. Um ihre Dienste zu entwickeln, nutzen KI-Unternehmen riesige Datenmengen, die im Internet verfügbar sind. Allerdings haben viele Verlage das Gefühl, dass sie ungerechtfertigt benachteiligt wurden, weil sie keine angemessene Vergütung erhielten. In einer neuen Entwicklung gibt es eine Kontroverse über Googles Haltung zur Bezahlung von KI-Schulungen, da diese während einer Anhörung vor dem britischen Lords Communications and Digital Committee unter die Lupe genommen wurde.

Roxanne Carter, eine Führungskraft für öffentliche Angelegenheiten bei Google, stellte klar, dass das Unternehmen nicht glaubt, dass es für „frei verfügbare“ Inhalte bezahlen sollte, die zum Trainieren seiner KI-Modelle verwendet werden.

Google verteidigt seine Position, Verlage nicht für KI-Schulungen anhand öffentlicher Daten zu bezahlen

Der Fall von Google basiert auf einer spezifischen Definition der Funktionsweise von KI. Carter sagt, dass KI-Modelle wie Gemini keine Datenbanken oder Systeme zum Auffinden von Informationen sind. Stattdessen durchsuchen sie riesige Datenmengen, um statistische Zusammenhänge und Muster zwischen Ideen und Wörtern zu finden. Laut Google besteht das Endziel darin, diese Muster zu nutzen, um „völlig neue Inhalte“ zu erstellen. Sie behaupten, dass ihre KI nicht nur kopiert, was Herausgeber oder Ersteller getan haben.

Google zahlt keine Kosten für Schulungen im offenen Web, unterscheidet jedoch zwischen allgemeinem Web Scraping und spezialisiertem Zugriff. Das Unternehmen macht aktiv Geschäfte für Archivinhalte und spezielle Datensätze, die der Öffentlichkeit nicht zugänglich sind. Kurz gesagt, das Unternehmen ist bereit, für den „Zugriff“ auf Daten zu zahlen, die sich nicht auf seiner eigenen Plattform befinden. Sie tun dies jedoch nicht, um die KI auf dem zu trainieren, was sie als öffentliche Domäne des Internets betrachten.

Googles KI-Übersichten: Das Opt-out-Dilemma

Für Verlage ist die Situation komplexer. Google hebt ein Tool namens „Google Extended“ hervor, das es Websitebesitzern ermöglicht, in der Google-Suche zu bleiben und gleichzeitig die Verwendung ihrer Inhalte zum Trainieren von KI-Modellen wie Gemini abzulehnen. Auf dem Papier klingt das nach einem fairen Kompromiss. Bei den „KI-Übersichten“ – den Zusammenfassungen, die ganz oben in den Suchergebnissen erscheinen – bleibt jedoch eine erhebliche Grauzone bestehen.

Auf die Frage, ob Verlage sich insbesondere von KI-Übersichten abmelden könnten, äußerten sich die Vertreter von Google vage. Die Verwendung bestimmter Tags scheint eine Möglichkeit zu sein, derzeit nicht in diesen Zusammenfassungen aufzutauchen. Leider kann es durch das Hinzufügen dieser Tags auch schwieriger werden, eine Website in den regulären Suchergebnissen zu finden. Dies bringt kleinere Verlage in eine schwierige Lage: Sie können ihre Arbeit entweder von KI zusammenfassen lassen (was die Anzahl der Direktklicks verringern könnte) oder riskieren, ihr Suchranking vollständig zu verlieren.

Die kleineren Player könnten am stärksten betroffen sein

Regierungsvertreter befürchten, dass große Medienunternehmen lukrative Geschäfte mit Technologiegiganten abschließen können, kleinere Unternehmen jedoch oft verpassen. Die Leute befürchten, dass KI-Zusammenfassungen mit den Artikeln, die sie zusammenfassen, konkurrieren könnten. Dies bedeutet, dass KI-Zusammenfassungen möglicherweise die eigene Arbeit des Erstellers nutzen, um Personen auf der Suchseite zu halten, anstatt sie an die Originalquelle weiterzuleiten.

Die Regulierungsbehörden beraten sich weiterhin zu diesen Fragen. Unterdessen bleibt die Definition von „fair use“ im Zeitalter der KI die ultimative Frage. Derzeit hält Google an der festen Überzeugung fest, dass das offene Web ein kostenloses Klassenzimmer für seine KI ist, auch wenn die Ersteller dieser Inhalte argumentieren, dass es ihre „kostenlosen“ Informationen sind, die die KI überhaupt erst wertvoll machen.