Gmail Voice Compose nutzt KI und Ihre Stimme zum Verfassen von E-Mails

Oscar

Google hat „Help Me Write“ bereits im Juni 2023 in Gmail eingeführt, und jetzt versucht Gmail Voice Compose, diesen KI-gestützten Komfort zu verbessern. KI-Tools haben aus gutem Grund Einzug in alle möglichen Dienstleistungen und Branchen gehalten. Die Zeiten wackeliger Spracherkennung und sich schlecht benehmender mobiler Assistenten sind längst vorbei. KI-gestützte Spracherkennung wirkt natürlich Wunder; da dies eine der ersten vorgeschlagenen Verwendungen großer Sprachmodelle war. Mit der neuesten Funktion von Gmail können Sie professionelle E-Mails erstellen, indem Sie einfach in Ihr Telefon sprechen.

Gmail Voice Compose funktioniert genauso wie „Hilf mir beim Schreiben“.

Mit der Funktion „Helfen Sie mir zu schreiben“ in den Gmail-Apps für Android und iOS können Benutzer E-Mails aus Textausschnitten verfassen. Benutzer schreiben die wichtigsten Punkte, worum es in ihrer E-Mail geht, und die KI erledigt den Rest. „Help Me Write“ spart nicht nur Zeit, es erstellt auch eine vollständige und professionelle E-Mail aus nur wenigen Zeilen informellen Textes. Voice Compose scheint auf die gleiche Weise zu funktionieren, aber indem man einem Benutzer beim Sprechen zuhört, anstatt ihn schreiben zu lassen.

Wie von TheSpAndroid entdeckt, enthält die Version 2023.12.31.599526178 der Gmail-Android-App eine neue Funktion, die über das Umschalten eines Flag-Werts zugänglich ist. Mit dieser Funktion können Sie sich beim Schreiben einer E-Mail selbst aufzeichnen, indem Sie auf eine Mikrofontaste tippen. Wenn Sie mit der Aufnahme fertig sind, wird AI durch Klicken auf „Erstellen“ aufgefordert, Ihre E-Mail aus Ihrer Aufnahme zu erstellen. Obwohl Voice Compose der Funktion „Hilf mir beim Schreiben“ sehr ähnlich ist, ist es definitiv schneller und bequemer.

Wie funktioniert KI-Speech-to-Text?

KI-Speech-to-Text kann das, was jemand sagt, viel genauer entschlüsseln als ältere Spracherkennungsmodelle. Der Leistungssprung war fast erschreckend, aber auch sehr verständlich, wenn man erst einmal versteht, wie LLMs funktionieren. Große Sprachmodelle werden stark vereinfacht als „Wortprädiktoren“ betrachtet. Sie sagen also voraus, welches Wort nach dem letzten kommen soll.

Diese Definition tut dem komplexen neuronalen Netzwerk von LLMs keinen Gefallen, hilft aber zu verstehen, wie ihre Spracherkennung funktioniert. Ältere Spracherkennungsmodelle analysierten jeden Laut und versuchten herauszufinden, um welches Wort es sich handelte. Dies würde sehr oft zu völlig unsinnigen Sätzen führen. Die KI-Spracherkennung hört nicht nur jedes einzelne Wort ab und analysiert es. Es vergleicht es mit allem, was zuvor gesagt wurde, und errät, was am wahrscheinlichsten gerade gesagt wurde. Aus diesem Grund ist die KI-Spracherkennung älteren Modellen meilenweit voraus; Es steckt eine gewisse Intelligenz dahinter.

Gmail Voice Compose sollte bald eingeführt werden, da angeblich bereits seit Oktober letzten Jahres daran gearbeitet wird. Wenn es genauso gut funktioniert wie andere KI-Sprach-zu-Text-Modelle, wird es für diejenigen, die die Gmail-App verwenden, einen gewaltigen Fortschritt in Sachen Komfort bedeuten.