Tumblr wird Daten an OpenAI & Midjourney verkaufen, um AI: Report zu trainieren

Oscar

Kurz nachdem Reddit einen massiven Deal über den Verkauf von Benutzerdaten zum Trainieren von KI unterzeichnet hat, scheint es, als würde Tumblr das Gleiche tun. Einem Bericht von 404media zufolge hat eine Insider-Quelle den Deal so gut wie bestätigt. 404media hat auch durchgesickerte interne Kommunikation zwischen Tumblrs Muttergesellschaft Automattic und den oben genannten KI-Unternehmen überprüft. Der Bericht behauptet, dass Benutzer die Weitergabe ihrer Daten ablehnen können.

Eine interne Quelle hat Details über den bevorstehenden Deal mitgeteilt

Eine Quelle mit Insiderwissen teilte 404media die Details mit, einschließlich interner Kommunikation. Laut 404media machen die Berichte deutlich, dass der Deal „unmittelbar bevorsteht“. Automattic, ebenfalls Eigentümer von WordPress, hat öffentlich erklärt, dass es auch Daten von dieser Website weitergeben wird. In der öffentlichen Erklärung wird nicht erwähnt, mit welchen Unternehmen Automattic Daten teilen würde.

In der Dokumentation war auch von einem kürzlich passierten Fehler die Rede. Anscheinend hat Tumblr versehentlich viele Benutzerdaten gelöscht, die eigentlich privat sein sollten oder sich auf gelöschte Beiträge beziehen. Dieser Datenscan sammelte Benutzerdaten von 2014 bis 2023 und wird an OpenAI und Midjourney weitergegeben. Cyle Gage, Produktmanager bei Tumblr, schreibt: „Die Art und Weise, wie die Daten für den ersten Datendump an Midjourney/OpenAI abgefragt wurden, bedeutet, dass wir eine Liste aller öffentlichen Postinhalte von Tumblr zwischen 2014 und 2023 zusammengestellt haben.“ Von nun an können Benutzer nur noch Daten auswählen, die sie nicht mehr mit den KI-Unternehmen teilen möchten. Ob die versehentlich gelöschten privaten Daten ebenfalls weitergegeben wurden, ist unbekannt.

Was der Verkauf von Daten durch Tumblr für die KI bedeuten könnte

Tumblr ist eine Social-Networking-Site, die sich auf Microblogging konzentriert. Obwohl dies viele Formen annehmen kann, ist es fast ausschließlich visueller Natur. OpenAI verfügt über ein KI-Modell zur Bildgenerierung namens DALL-E. Das gesamte Geschäftsmodell von Midjourney dreht sich um die Bilderzeugungs-KI. Für diese Unternehmen sind riesige Datenmengen über gelegentliche Interaktionen von unschätzbarem Wert. Tumblr und WordPress bieten ihnen genau das.

Mit den Daten von Tumblr werden beide Unternehmen eine enorme Steigerung ihrer Möglichkeiten zur Bildgenerierung erleben. Darüber hinaus sind die spezifischen Daten, die Tumblr bereitstellt, insbesondere in diesem Umfang, ziemlich einzigartig. Memes, Bildunterschriften und einzigartige Kunststile, die es sonst nirgendwo gibt. Tumblr blockiert bereits seit langem KI-Crawler, wie in der Stellungnahme von Automattic erwähnt wird. Mit diesem Deal kann das Unternehmen nicht nur von seinen Daten profitieren, sondern möglicherweise auch den Wert von Tumblr steigern. Yahoo kaufte das Unternehmen im Jahr 2013 für 1 Milliarde US-Dollar, Automattic übernahm es jedoch im Jahr 2019 für nur 3 Millionen US-Dollar.