Google präsentiert einen videobasierten Gemini-Prototyp für Konversationen

Oscar

Die nächste Google I/O 2024-Konferenz findet morgen statt. Das Unternehmen ist jedoch bestrebt, der Öffentlichkeit einige seiner großen Fortschritte im Bereich KI zu zeigen. Im Vorfeld der Veranstaltung präsentierte Google einen dialogorientierten Gemini-Prototyp, der in Echtzeit auf Videos reagiert.

KI-gestützte Chatbots reagierten zunächst auf schriftliche Eingabeaufforderungen. Einige Zeit später erlangten sie die Fähigkeit, Bilder zu erkennen. Seitdem können sie Fragen beantworten oder Kommentare zu einem bestimmten Bild oder Bildelement abgeben. Sie können sogar neue Bilder von anderen generieren. Der nächste große Schritt scheint nun mit Video zu tun zu haben.

Google stellt vor der I/O 2024 einen interaktiven Gemini-Prototyp mit Video vor

Im Vorfeld der I/O 2024 zeigt Google ein kurzes Video einer Interaktion zwischen Gemini und einem Nutzer. Das Auffällige ist, dass die gesamte Interaktion auf in Echtzeit aufgenommenen Videos basiert. Der „Teaser“ zeigt, wie Zwillinge erkennen können, was in der Szene passiert. Es kann sich auch gezielt auf einige Elemente der Szene konzentrieren, beispielsweise auf das Google I/O-Logo. Anschließend beantwortet der KI-gestützte Chatbot die Fragen des Benutzers und schlägt sogar neue Fragen zum „Chatten“ vor.

Die Kombination aus Echtzeit-Videoerkennung und natürlicher Gesprächsführung ist durchaus beeindruckend. Allerdings ist zu beachten, dass es sich bei dem Gezeigten um einen scheinbar funktionsfähigen Prototypen handelt. Obwohl das Unternehmen morgen weitere Einzelheiten dazu bekannt geben wird, ist es möglich, dass es etwas länger dauern wird, bis eine endgültige Version für den Massengebrauch verfügbar ist.

Der Teaser könnte eine direkte Reaktion auf Open AI sein, das Team hinter ChatGPT. Vor einigen Stunden veranstaltete das Unternehmen eine Veranstaltung, um neue Fortschritte und Funktionen anzukündigen. Eine der Ankündigungen war GPT-4o, eine schnellere Version des GPT-4-Modells, die auch auf Live-Videos reagieren kann. Der von Google gewählte Zeitpunkt für die Veröffentlichung des Teasers scheint also kein Zufall zu sein.