Der Google Whisk AI-Bildgenerator ersetzt Eingabeaufforderungen durch Bilder

Das Engagement von Google für KI-gestützte Dienste als wichtigen Teil seines Geschäfts trägt weiterhin Früchte. Das Unternehmen hat Google Whisk als Bildgenerator angekündigt, der sich jedoch von anderen ähnlichen Produkten unterscheidet. Mit Google Whisk können Sie Bilder mithilfe anderer Bilder statt nur mit Textaufforderungen erstellen.

Die meisten aktuellen KI-Bildgeneratoren basieren auf einem Textfeld, in das Sie Ihre Eingabeaufforderungen schreiben können. Was aber, wenn Sie ein Bild mit bestimmten Elementen erstellen möchten, aber nicht wissen, wie Sie diese richtig beschreiben sollen? Es kann frustrierend sein, mehrere Eingabeaufforderungen auszuprobieren und nie das gewünschte Ergebnis zu erhalten. Vor diesem Hintergrund können Sie mit Google Whisk mithilfe anderer Bilder beschreiben, was Sie möchten, was die Sache erheblich vereinfachen könnte.

Google Whisk verwendet andere Bilder, um Bilder zu generieren

Die von Google Whisk generierten Bilder haben drei Hauptparameter: das Motiv, die Szene und den Stil. Der neue Service des Mountain View-Riesen ermöglicht es Ihnen, ein Bild – oder sogar mehrere – zu verwenden, um jedes Bild zu definieren. Wenn Sie noch konkreter sein möchten, bietet Whisk auch ein Textfeld an, mit dem Sie zusätzlichen Kontext hinzufügen können. Grundsätzlich sind Bilder in Whisk das Hauptelement zur Generierung von Inhalten, während Text nur ein ergänzendes Element ist.

Interessanterweise fügt Whisk in jedes generierte Bild eine Textaufforderung ein. Dadurch erhalten Sie eine klarere Vorstellung davon, wie Sie auf anderen Plattformen der Generation IA ein ähnliches Bild nur mit Text erhalten. Der Dienst ermöglicht Ihnen sogar die Verwendung von Textaufforderungen, um Änderungen an den generierten Bildern vorzunehmen.

Whisk basiert auf Imagen 3, dem neuesten KI-Bildgenerierungsmodell von Google. Es ist ein unterhaltsames Werkzeug und kann auch nützlich sein, aber es ist nicht perfekt. Google sagt, es sei für „entworfen“schnelle visuelle Erkundung, keine pixelgenauen Bearbeitungen.“ Der Mountain View-Riese warnt auch davor, dass das Tool „das Ziel verfehlen“ Manchmal. Glücklicherweise hilft die Möglichkeit, Bilder mit Textaufforderungen zu optimieren, dieses Problem zu mildern. Sie können in Zukunft mit erheblichen Verbesserungen rechnen, da Whisk derzeit das Label „experimentell“ trägt.

Zunächst nur in den USA erhältlich

Google Whisk ist derzeit nur in den USA verfügbar. Sie erhalten ein „Whisk ist in Ihrem Land noch nicht verfügbar”-Meldung, wenn Sie versuchen, von einem anderen Land aus darauf zuzugreifen. Wenn Sie jedoch außerhalb der USA leben und über ein zuverlässiges VPN verfügen, können Sie die Einschränkung möglicherweise umgehen und auf das Tool zugreifen.

In ähnlichen Nachrichten kündigte Google auch Veo 2 als sein neues KI-Videogenerierungsmodell an. Nach Angaben des Unternehmens weist Veo weniger „Halluzinationen“ auf als andere ähnliche Modelle. Google plant, in naher Zukunft Veo 2-Funktionen in die generativen Tools von YouTube Shorts zu integrieren.