Das Gemini-Video von Google wurde inszeniert, was eine gewisse Erleichterung darstellt

Oscar

Deshalb hat Google gerade seinen multimodalen Moloch namens Gemini auf den Markt gebracht. Es handelt sich um das neue, äußerst leistungsstarke KI-Modell des Unternehmens, das es mit Modellen wie GPT-4 aufnehmen kann. Im Rahmen aller Eröffnungsfeierlichkeiten sahen wir ein praktisches Video, das die Fähigkeiten von Gemini demonstrierte. Nun, Google gab zu, dass sein Gemini-Hands-on-Video gefälscht war.

Um Sie auf dem Laufenden zu halten: Als Google Gemini startete, zeigte es ein praktisches Video, in dem die Person einige von Geminis Fähigkeiten vorführte. Es erweckte den Eindruck, dass Gemini Audio- und Videodaten in Echtzeit verarbeitete. Wenn die Person einen Gegenstand in die Kamera steckte, stellte sie den Zwillingen Fragen zu dem, was sie „sieht“, und gab Antworten. Wir würden eine von der KI erzeugte Stimme als Antwort hören.

Es ist ein großartiges Beispiel für die Fähigkeiten von Gemini … oder es wäre es, wenn es ECHT wäre.

Google gibt zu, dass sein Gemini-Hands-on-Video gefälscht war

Ein Meinungsartikel von Bloomberg hat dieses bisschen Unsinn verschüttet. Darin heißt es, Google habe enthüllt, dass das Video nicht 100 % echt sei. Die stimmlichen Interaktionen in Echtzeit zwischen dem Moderator und Gemini waren nicht vorhanden. Das war alles der Magie der Videobearbeitung zu verdanken. Außerdem wurden die Interaktionen in der Post beschleunigt, wodurch alles schneller wirkte, als es tatsächlich ist.

Obwohl das Video nicht zu 100 % echt war, können wir nicht sagen, dass es zu 100 % gefälscht war. Es ist ein Schaufenster der Fähigkeiten der Zwillinge, und wir sehen immer noch ihre Fähigkeiten. Google verwendete „Standbilder aus dem Filmmaterial und Eingabeaufforderungen per Text“. Anstatt also ein lockeres Gespräch mit Gemini zu führen, speiste das Unternehmen Standbilder in das Modell ein und tippte ein, was Gemini produzieren sollte.

Im Wesentlichen sehen wir immer noch die Fähigkeiten von Gemini; Wir sehen immer noch, was es angesichts der Eingaben bewirken kann. Google nutzte Hollywood-Magie, um es mächtiger erscheinen zu lassen, als es ist. Was die Geschwindigkeit der Antworten angeht, gab Google in der Beschreibung an, dass die Antworten aus Gründen der Kürze beschleunigt wurden.

Hat das Unternehmen damit Unrecht? Wer weiß? Das ist eine Debatte für den YouTube-Kommentarbereich.

Das Video war inszeniert, und das ist eine kleine Erleichterung

Unabhängig davon, ob das Video gefälscht war, ist es immer noch viel mächtiger als Bard. Das Modell ist intelligenter mit mehr Token und Parametern, bla bla bla. Was auch immer passiert, Unternehmen werden immer noch über Tools verfügen, mit denen sie Produktion und Effizienz steigern können. Es gibt auch mehrere Möglichkeiten, auf Gemini zuzugreifen.

Allerdings war das Video für alle Zuschauer, die es sahen, ziemlich gruselig. Wir haben buchstäblich gesehen, wie Gemini in Sekundenschnelle ein cooles tropisches Lied geschaffen hat, wofür ein Komponist viel länger brauchen würde. Wir haben auch gesehen, dass es in Sekundenschnelle Bilder aus Garn erstellt. Seit DALL-E endlich funktioniert und ChatGPT auf den Markt gekommen ist, stehen menschliche Schöpfer kurz davor, obsolet zu werden. Die Situation wird nicht besser, und das praktische Video ließ es wirklich so aussehen, als hätte Google den YouTubern endlich den letzten Nagel in den Sarg geschlagen.

Die Tatsache, dass es inszeniert wurde, zeigt jedoch, dass die Technologie noch nicht ganz ausgereift ist. Kreative haben einfach etwas mehr Zeit. Das ist alles, was wir an dieser Stelle verlangen können.