Das SynthID-Text-Tool von Google ist endlich gestartet

Es wird immer schwieriger zu erkennen, was im Internet KI-generiert wurde, und das gilt insbesondere für KI-generierten Text. Für KI ist es viel einfacher, Text zu fälschen als für Audio, Bilder oder Videos. Daher scheint es eine unmögliche Aufgabe zu sein, diesen Inhalt mit einem Wasserzeichen zu versehen. Es scheint jedoch, dass Google mit dem SynthID Text-Tool eine Lösung hat.

Da KI so überzeugend ist, ist es wichtig, über Tools zu verfügen, mit denen Menschen erkennen können, ob eine Forschungsarbeit von ChatGPT ausgespuckt wurde. Das Betrügen Ihres Hochschulzeugnisses ist zwar schlecht, aber bei weitem nicht das Schädlichste, was Sie mit KI-generiertem Text anstellen können. Ein großes Problem ist die Verbreitung von Fehlinformationen und anderen schädlichen Inhalten.

Hier kommt Google SynthID Text ins Spiel

Die Unternehmen, die uns die leistungsstärksten KI-Chatbots zur Verfügung stellen, versuchen auch, uns Tools an die Hand zu geben, mit denen wir erkennen können, wann etwas von diesen Chatbots erstellt wurde. OpenAI hat Tools entwickelt und getestet, um zu erkennen, wann etwas von ChatGPT erstellt wurde, aber das Unternehmen hielt es nicht für angebracht, es zu veröffentlichen.

Google hingegen hat uns mit einem Wasserzeichen-Tool gesegnet. Wie der Name schon sagt, handelt es sich dabei um ein Tool, mit dem Menschen erkennen können, ob ein Textabschnitt KI-generiert ist. SynthID Text ist ab heute für Entwickler und Unternehmen kostenlos verfügbar. Wir sind uns nicht sicher, ob Google ein benutzerorientiertes Tool für Gelegenheitsnutzer veröffentlichen wird, um zu überprüfen, ob Text von der KI generiert wurde.

Text mit Wasserzeichen versehen?

Das scheint etwas zu sein, was eigentlich unmöglich sein sollte. Es ist einfacher, das Wasserzeichen von KI-generierten Bildern zu verstehen. Allerdings ist Text viel einfacher zu bearbeiten. Sie können den von einem Chatbot erstellten Text ganz einfach bearbeiten oder umschreiben. Google hat es geschafft, einen Weg zu finden, aber er ist nicht perfekt.

Diese Methode hat mit dem zu tun, was aufgerufen wird Token. Wenn Sie sich mit KI-Tools auskennen, ist Ihnen dieser Begriff wahrscheinlich schon einmal begegnet. Wenn Sie ein KI-Tool verwenden, geben Sie Daten ein und erhalten Daten als Ausgabe. Geben Sie beispielsweise die Aufforderung „Schreiben Sie eine Geschichte über ein Kaninchen“ in einen Chatbot ein und erhalten Sie als Antwort eine Geschichte mit 100 Wörtern.

Nun, der Text in Ihrer Eingabeaufforderung ist in sogenannte Token unterteilt. Hierbei handelt es sich um Wortabschnitte oder ganze Wörter, die Sie in ein Modell eingeben, um sie aufzuschlüsseln und zu analysieren. Ihre Antwort besteht ebenfalls aus Token.

Wenn ein Modell Text generiert, gibt es laut Google jedem Token eine Bewertung, die darauf basiert, wie wahrscheinlich es ist, dass es in der Antwort verwendet wird. SynthID Text fügt zusätzliche Informationen in jedes Token ein, indem „Modulieren der Wahrscheinlichkeit, dass Token generiert werden.„Dann vergleicht Google die Punktzahl aus der Ausgabe des Originalmodells mit der angepassten Punktzahl. Das endgültige Muster dieser Bewertungen ist dann „mit dem erwarteten Bewertungsmuster für Text mit und ohne Wasserzeichen verglichen, um SynthID dabei zu helfen, zu erkennen, ob ein KI-Tool den Text generiert hat oder ob er möglicherweise aus anderen Quellen stammt.“ sagt Google.

Einschränkungen

Es ist eine Menge zu bedenken, aber es ist wichtig zu beachten, dass es sich um ein ziemlich effektives Werkzeug handelt. Das Einzige ist, dass dies keine wasserdichte Lösung ist. SynthID-Text ist nicht so genau, wenn es um kürzere Textabschnitte geht. So haben Sie mehr Glück, wenn jemand einen Roman oder einen Hochschulbericht erstellen möchte, aber Sie werden Schwierigkeiten haben, wenn es sich um einen Werbetext handelt.

Außerdem hat dieses Tool Probleme mit Texten, die aus einer anderen Sprache übersetzt oder neu geschrieben wurden. Dies ist sinnvoll, da dadurch grundsätzlich alle Tokens des Originaltextes verändert würden.

Darüber hinaus sind Antworten auf sachliche Fragen auch für SynthID Text ein Thema. Dies liegt daran, dass es schwierig ist, die Token-Scores anzupassen, ohne die tatsächlichen Sachinformationen in der Antwort zu ändern. Wenn Sie über den natürlichen Lebensraum eines bestimmten Vogels sprechen, können Sie an Ihrer Antwort kaum etwas ändern, bevor Sie anfangen, die tatsächlichen Fakten zu ändern.

In einer etwas überraschenden Ankündigung gab Google an, dass dieses Tool bereits vor Monaten in Gemini integriert wurde und die meisten von uns es nicht einmal wussten. Hoffentlich wird dieses Tool wegweisend für andere Tools sein, die uns bei der Erkennung von KI-generierten Inhalten helfen.