Heutzutage sollten wir mit Gemini ziemlich vertraut sein, da Google es in alle seine Produkte integriert hat. Während Google mit seinen KI-Modellen einige bedeutende Fortschritte gemacht hat, verwenden wir alle Gemini Version 1 und 1.5. Nun, Google hat gerade die nächste Generation von Gemini angekündigt, Gemini 2.0.
Es ist wichtig zu wissen, dass dies nur eine Ankündigung war. Wir werden Gemini 2.0 noch nicht in irgendwelchen Diensten implementiert sehen. Wir werden es jedoch in einem der am meisten erwarteten KI-Tools sehen, die Google vorgestellt hat.
Google hat gerade Gemini 2.0 angekündigt.
Die Ankündigung des Unternehmens zeigt, dass wir uns tatsächlich im Zeitalter der KI-Automatisierung befinden. Google hat ein kurzes und ansprechendes Video veröffentlicht, in dem einige der Pläne des Unternehmens detailliert beschrieben werden. Darin sehen wir, dass sich Gemini 2.0 auf leistungsfähige KI-Agenten konzentrieren wird, die Aufgaben im Namen des Benutzers ausführen können. Auch andere Unternehmen wie Motorola arbeiten an Modellen, die Aktionen app-übergreifend durchführen können.
Wie Sie sich vorstellen können, sind die Ambitionen von Google größer. Auf der Grundlage von Gemini 2.0 könnte das Unternehmen Tools entwickeln, die einen Agenten schaffen, der nahezu alles kann. Multimodalität ist der Schlüssel dafür, dass dies funktioniert, da Gemini 2.0 in der Lage sein wird, Informationen aus verschiedenen Eingabeformen aufzunehmen. Stellen Sie sich vor, Sie könnten Ihr Telefon auf ein Objekt in der realen Welt richten und Fragen dazu stellen.
Kommt Ihnen das bekannt vor? Dies hat Google gezeigt, als es das Projekt Astra enthüllte. Nun, dem Video zufolge wird Gemini 2.0 das Projekt Astra antreiben. Falls Sie vergessen haben, was es ist, können Sie Ihr Telefon auf ein Objekt in der realen Welt richten und Fragen dazu stellen. Sie können direkt mit dem Agenten sprechen und erhalten eine mündliche Antwort.
Auf dieses Tool haben die Leute seit Google I/O gewartet. Wir wissen nicht, wann das Unternehmen dies der Öffentlichkeit zugänglich machen wird, aber wir sind sicher, dass es bei den Benutzern gut ankommen wird.
Das könnte ein super hilfreiches Modell sein
Wissen Sie nur, dass dieses Video zeigt, was Google plant. Es ist keine Darstellung dessen, was das Unternehmen auf den Markt bringen wird. Eine Sache, die Google in dem Video zeigte, war das Konzept von Gemini 2.0, das jemandem beim Spielen von Clash of Clans hilft. Der Spieler fragte Gemini, wo er die feindliche Basis angreifen sollte, und er konnte den Kontext aus dem, was auf dem Bildschirm des Spielers angezeigt wurde, ermitteln.
Dann hörten wir eine Stimme, die erklärte, von wo aus wir die Basis angreifen sollten und warum. Während das auf Seiten des Spielers eher faul erscheint, zeigt es, dass Google möchte, dass seine KI ziemlich tief in Ihr Smartphone-Erlebnis eindringt.
Projekt Mariner
Google gab uns einen kleinen Einblick in sein nächstgrößtes Projekt. Project Mariner lässt Gemini komplexe Aufgaben mit einem einfachen Befehl ausführen. Nehmen wir einfach an, Sie möchten, dass Zwillinge den berühmtesten postimpressionistischen Maler finden, ein Gemälde von ihnen auf Google Arts and Culture finden und dann ein paar farbenfrohe Farben in Ihren Etsy-Warenkorb legen. Das klingt ziemlich spezifisch, aber vielleicht können Sie das tun, wenn Google Project Mariner vollständig realisiert.
Das einzige Modell, über das Google derzeit spricht, heißt Gemini 2.0 Flash Experimental. Das bedeutet, dass das Unternehmen gerade dabei ist, es zu testen. Wir wissen also nicht, wann das Unternehmen eine endgültige Version der breiten Masse zugänglich machen wird.