OpenAI kündigt „Voice Engine“ zur Erzeugung menschlicher Stimmen an

Oscar

OpenAI kann jetzt mit seiner „Voice Engine“-Plattform menschliche Stimmen nachbilden. Das von Microsoft finanzierte Unternehmen hält die neue KI-Engine aufgrund offensichtlicher ethischer und rechtlicher Implikationen für ernst.

Nach dem großen Erfolg von ChatGPT, DALL-E und Sora wagt sich OpenAI nun in den Bereich des Klangs vor, insbesondere der menschlichen Sprache und Stimme. Die Voice Engine AI befindet sich derzeit in der Beta-Testphase, Internetnutzer können sich jedoch möglicherweise nicht für ein Abonnement anmelden.

Voice Engine kann mehrsprachige menschliche Stimmen mit nur 15-Sekunden-Aufnahmen nachbilden

ChatGPT eroberte die Welt im Sturm, DALL-E eröffnete Millionen Kreativität und Sora könnte es normalen Internetnutzern bald ermöglichen, Filme zu machen. Nach Texten, Bildern und Videos hat OpenAI nun Voice Engine angekündigt, eine KI-Plattform, die menschliche Stimmen nachbilden kann.

Die New York Times erhielt eine Demo der Voice Engine-Plattform. Berichten zufolge kann die KI-Engine die Stimme eines Menschen aus einer 15-sekündigen Aufnahme nachbilden. Wenn das nicht schon beängstigend genug ist, kann Voice Engine nach Aufnahme der benötigten Informationen jede beliebige Textaufforderung in die nachgebildete menschliche Stimme vorlesen.

Überraschenderweise muss die Textaufforderung nicht einmal in der Muttersprache des Sprechers erfolgen, dessen Stimme zum Trainieren der KI-Engine verwendet wurde. Mit anderen Worten: Ein englischer Muttersprachler könnte über Voice Engine Spanisch, Französisch, Chinesisch oder viele andere Sprachen sprechen.

Angesichts der offensichtlichen Fallstricke einer solchen Technologie hat OpenAI versichert, dass es mehrere Sicherheitsprüfungen wie Wasserzeichen untersucht. Es würde Kontrollen geben, die Voice Engine daran hindern, die menschlichen Stimmen bestimmter Personen zu erzeugen.

Interessanterweise hat OpenAI-Produktmanager Jeff Harris angeblich behauptet, das Unternehmen habe keine unmittelbaren Pläne, mit der Technologie Geld zu verdienen. Der Hauptzweck des Projekts bestehe darin, Menschen zu helfen, die durch Krankheit oder Unfall ihre Stimme verloren haben, fügte er hinzu.

Wird OpenAI seine neueste Kreation Internetnutzern als Abonnement anbieten?

Sora von OpenAI, mit dem Benutzer einen 60-Sekunden-Film mit nur Textaufforderungen erstellen können, ist nicht für die breite Öffentlichkeit verfügbar. Ebenso hat das Unternehmen keine Version von Voice Engine veröffentlicht.

Voice Engine steht derzeit „einer kleinen Gruppe von Unternehmen“ zur Verfügung. Vereinfacht gesagt haben einige wenige Unternehmen, vermutlich auf Einladung, eingeschränkten Zugriff auf die Plattform.

Es erübrigt sich zu erwähnen, dass eine KI-Plattform, die auf der Grundlage einer 15-minütigen Aufnahme menschliche Stimmen in mehreren Sprachen nachbilden kann, enorme ethische und rechtliche Auswirkungen hat.

OpenAI hat möglicherweise eingeschränkten Zugriff auf Voice Engine. Es ist jedoch besorgniserregend festzustellen, dass sich die KI in einen Giganten verwandelt hat.

Neben überzeugenden Deep-Fake-Bildern und -Videos nutzen Betrüger und Betrüger seit geraumer Zeit KI, um menschliche Stimmen nachzuahmen. Mehrere Opfer wurden Opfer gefälschter Sprachnachrichten, die so klangen, als wären ihre Verwandten in Schwierigkeiten und würden um Geld bitten.

In den falschen Händen könnte Voice Engine die Stimmen von Politikern, Prominenten, Journalisten und anderen prominenten Persönlichkeiten akzeptieren und wiederherstellen. Über die Plattform könnten überzeugende Audioclips erstellt werden, die Fehlinformationen oder Propaganda verbreiten. In einem ebenso beängstigenden Szenario könnten Hacker und Kriminelle Sicherheitssysteme gefährden, die auf Sprachauthentifizierung basieren.

Daher würde OpenAI die Voice Engine-Plattform höchstwahrscheinlich stark zensieren und regulieren. Es müsste einige robuste und intelligente digitale Schlösser sowie strenge Sicherheitskontrollen entwickeln, um Missbrauch zu verhindern.

Abgesehen von Sicherheits- und ethischen Bedenken könnte die Voice Engine von OpenAI für Film- und Webserienproduzenten, die ihre Kreationen in andere Sprachen synchronisieren müssen, enorm hilfreich sein. Auch der Bildungs- und Unterhaltungsbereich könnte enorm davon profitieren.