Google Bard übernimmt Imagen als Tool zur Bildgenerierung

Google erweitert sein generatives KI-Angebot um einen kommenden Bildgenerator für Google Bard, as enthüllt in einem unveröffentlichten Changelog vom 18. Januar.

In Anlehnung an Tools wie Search Generative Experience (SGE) und Slides können Benutzer Bilder erstellen, indem sie ein paar Wörter eingeben, die das Bild beschreiben. Diese neue Funktion wird voraussichtlich auf der Imagen-Modellfamilie von Google basieren. Imagen ist für seine Fähigkeit bekannt, qualitativ hochwertige, fotorealistische Bilder zu erstellen.

Im Dezember stellte Google Imagen 2 vor, das sich durch eine deutlich verbesserte Bildqualität auszeichnet. Die Technologie zielt auf Unternehmensanwendungsfälle ab, beispielsweise die Erstellung von Logos oder die Erstellung von Bildern mit Texteinblendungen.

Es wird erwartet, dass der Bildgenerator von Google Bard ähnliche Sicherheitsfunktionen wie SGE aufweist. Letzteres wurde im Oktober eingeführt und ermöglicht es Benutzern, Eingabeaufforderungen direkt in das Suchfeld zu „zeichnen“ oder zu „skizzieren“, wodurch vier Bilder gleichzeitig generiert werden.

Genau wie SGE blockiert auch Google Bard Ergebnisse mit bemerkenswerten Personen und expliziten Inhalten

SGE sorgt für Sicherheit, indem es die Generierung schädlicher, irreführender oder expliziter Inhalte blockiert. Laut 9to5Google wird Bard auch Eingabeaufforderungen mit prominenten Personen oder fotorealistischen Gesichtern einschränken. Darüber hinaus erhält jedes generierte Bild eine Metadaten-Beschriftung und ein unsichtbares Wasserzeichen mithilfe der SynthID von Google.

Google Slides und Meet, letzteres für benutzerdefinierte Hintergründe, integrieren bereits die benutzerorientierte Bildgenerierung durch Duet AI. Die bevorstehende Hinzufügung eines Bildgenerators zu Bard erweitert die Zugänglichkeit von KI-generierten Inhalten über verschiedene Google-Dienste hinweg.

Durch das Hinzufügen weiterer Beschreibungen zu Bildunterschriften im Trainingsdatensatz von Imagen 2 verbessert Google das Verständnis von Bildunterschriften. Dies ermöglicht eine genauere und kontextuell differenziertere Bilderzeugung.

Darüber hinaus geht Imagen 2 auf häufige Herausforderungen ein, mit denen Text-zu-Bild-Tools konfrontiert sind, wie etwa die Darstellung realistischer Hände und menschlicher Gesichter. Die Technologie beinhaltet ein spezielles Bildästhetikmodell. Es basiert auf menschlichen Vorlieben und stellt sicher, dass die erzeugten Bilder den von den Benutzern bevorzugten Qualitäten entsprechen. Diese Fortschritte tragen gemeinsam zur verbesserten Fähigkeit von Imagen 2 bei, qualitativ hochwertige und realistische Bilder zu erzeugen.

Der Schritt steht im Einklang mit der umfassenderen Strategie von Google, fortschrittliche KI-Technologien in sein Dienstleistungsangebot zu integrieren.