Die größten KI-Ankündigungen während der Google I/O 2024

Oscar

Es überraschte niemanden, dass Google am ersten Tag der Google I/O eine Menge KI-Goodies ankündigte. Die Show ist jetzt zu Ende, aber wir sind alle immer noch erschüttert von den unglaublichen Ankündigungen, die Google gemacht hat. Zweifellos war 2024 ein großes Jahr für Zwillinge, und diese Ankündigung unterstreicht diese Tatsache nur. Was waren also die größten KI-Ankündigungen während der Google I/O? Hier ist ein Überblick.

Bevor wir beginnen: Wenn Sie einen Überblick über weitere große und kleine Ankündigungen wünschen, sollten Sie sich unsere Google I/O-Zusammenfassung ansehen. Es geht auf das Wesentliche ein, was das Unternehmen angekündigt hat.

Größte KI-Ankündigungen während der Google I/O 2024

Wenn wir jede einzelne KI-Ankündigung des Unternehmens auflisten, wird dieser Artikel so lang sein, dass Sie ihn bis zur Google I/O 2025 lesen würden! Deshalb listen wir die bahnbrechendsten Ankündigungen auf, die Google uns gegeben hat. Hierbei handelt es sich um Funktionen, die allgemein verfügbar sein werden und einen erheblichen Einfluss darauf haben, wie Sie Google-Produkte nutzen, die Produktivität steigern oder eine Kombination aus beidem.

Gemini 1.5 Pro/Flash

Zu Beginn der Ankündigung stellte uns Google sein neuestes Modell namens Gemini 1.5 Pro vor. Dies ist das fortschrittlichste Modell des Unternehmens und wird auf mehrere KI-gestützte Produkte des Unternehmens ausgeweitet.

Gemini 1.5 Pro verbessert die ältere Version von Gemini in allen wichtigen Bereichen. Es ist schneller in der Verarbeitung, intelligenter und viel leistungsfähiger. Das Besondere daran ist das erweiterte Kontextfenster. Gemini 1.5 Pro kann bis zu einer Million Token akzeptieren. Das ist einzigartig und bedeutet, dass pro Eingabeaufforderung viel mehr Informationen aufgenommen werden können. Wir reden über eine ganze Buchreihe mit Text, stundenlangem Audio, einer ganzen Stunde Video usw. Stellen Sie sich vor, Sie laden einen ganzen Podcast hoch und erhalten eine prägnante Zusammenfassung dessen, was besprochen wurde. Darüber hinaus testet Google auch eine 2-Millionen-Token-Version von Gemini 1.5 Pro.

Gleichzeitig kündigte Google auch Gemini 1.5 Flash an. Dies ist im Grunde eine abgespeckte Version von Gemini 1.5 Pro. Es ist schneller, kompakter und effizienter. Wie dem auch sei, es gibt immer noch das Limit von 1 Million Token.

KI-Ergänzungen zur Gmail-App

Gmail ist einer der beliebtesten E-Mail-Clients der Welt, und Google hat es mit der erstaunlichen Gemini-Integration noch viel besser gemacht. Erstens erhält Gmail eine Zusammenfassungsfunktion. Das ist unkompliziert. Wenn Sie über einen längeren Zeitraum E-Mails erhalten und keine Lust haben, alle E-Mails durchzulesen, können Sie die Zusammenfassungsfunktion verwenden, um eine prägnante und leicht lesbare Zusammenfassung aller E-Mails zu erhalten. Wenn Sie alle Details des E-Mail-Threads sehen möchten, können Sie natürlich die E-Mails durchlesen. In den meisten Fällen reicht es jedoch aus, einen kurzen Überblick über alles zu erhalten.

Kostenlose Nutzer werden enttäuscht sein, da Sie diese Funktion nur nutzen können, wenn Sie Workspace-Kunde sind oder das Google One AI Premium-Abonnement nutzen.

Eine weitere tolle Funktion ist die Q&A-Funktion von Gmail. Auf diese Weise können Sie Gemini Fragen zum Inhalt von E-Mail-Threads stellen. Dann kann Zwillinge diese Fragen für Sie beantworten. Wenn Sie sich hin und her über den Vergleich von Immobilienpreisen unterhalten, können Sie Gemini etwas fragen wie „Welcher potenzieller Käufer hat mir das beste Angebot gemacht?“ Zwillinge sollten diese Frage für Sie beantworten können.

Fragen Sie Google nach Fotos

Derzeit verfügt Google Fotos über eine ziemlich verrückte KI, aber das bedeutet nicht, dass das Unternehmen sie nicht verbessern kann. Mit Gemini ist die künstliche Intelligenz, die Google Fotos antreibt, jetzt viel fortschrittlicher.

Das Unternehmen hat die Funktion „Fotos fragen“ vorgestellt und sie ist ziemlich beeindruckend. Grundsätzlich können Sie Gemini bestimmte allgemeine Fragen stellen, die sich auf die von Ihnen aufgenommenen Bilder und Videos beziehen können. Google nannte als Beispiel die Frage, wie sich ein Kind im Laufe der Jahre beim Schwimmen verbessert habe. Zwillinge können Ihre Fotos durchsehen, das Kind identifizieren, alle Bilder und Videos von ihm beim Schwimmen identifizieren und Ihnen eine Zeitleiste über seine Fortschritte geben. Das ist nur ein Beispiel für den Nutzen dieser Funktion.

Diese Option wird in der unteren Leiste der Google Fotos-App angeheftet.

Projekt Astra

Dies ist ein äußerst beeindruckendes Beispiel für die Kraft der Zwillinge. Während der Präsentation stellte das Unternehmen das Projekt Astra vor, ein Tool, das Gemini Augen verleiht. Google wird dies irgendwann in die Gemini-App implementieren.

Wenn Sie die Funktion aktivieren, wird in der App ein Sucher angezeigt. Zwillinge können erkennen, was sich im Sucher befindet. In einem von Google angeführten Beispiel fragte ein Google-Ingenieur Gemini, welcher Gegenstand auf seinem Schreibtisch Geräusche mache. Der Ingenieur zeigte dann auf einen Lautsprecher und Gemini konnte feststellen, dass der Lautsprecher Geräusche macht. Außerdem zeichneten sie einen Pfeil auf den Bildschirm, der auf den Hochtöner des Lautsprechers zeigte. Nachdem der Ingenieur gefragt hatte, was das sei, konnte Gemini erkennen, dass es sich um den Hochtöner des Lautsprechers handelte, und beschrieb, was es war.

Das ist nur ein Beispiel. Der Ingenieur konnte Gemini auch dazu bringen, ihren Standort zu identifizieren, indem er die Kamera nach draußen richtete. Zwillinge konnten erkennen, in welchem ​​Teil der Stadt sie sich befanden.

Da es sich um Zwillinge handelt, können Sie ihn so ziemlich alles fragen, was Sie wollen. Sie können ihm Fragen zu Objekten stellen, die sich im Sucher befinden, ihn bitten, darauf basierende Inhalte zu erstellen usw.

Das Unternehmen gab an, dass einige der Funktionen von Project Astra noch in diesem Jahr in die Gemini-App aufgenommen werden. Wir haben jedoch keine Ahnung, was diese Funktionen sind, also müssen wir warten.

Bild 3

Falls Sie es nicht wissen: Alle mit Gemini generierten Bilder verwenden Googles proprietäres Bildmodell namens Imagen. Nun, das Unternehmen stellte Imagen 3 vor, sein fortschrittlichstes Modell. Damit können Menschen viel realistischere Bilder mit hinzugefügten feinen Details erstellen. Wenn Sie sich also für die Generierung von KI-Bildern interessieren, ist dies etwas, worüber Sie sich freuen können. Es strebt nach Fotorealismus und erreicht ihn auch.

Veo

Um noch einen Schritt weiter zu gehen, stellte Google auch seine Plattform zur Videogenerierung vor. Dies wird die Leute an die Videogenerierungsplattform von OpenAI namens Sora erinnern. Sora ist in der Lage, einige sehr realistisch aussehende Videoclips zu erstellen.

Während der Google I/O stellte das Unternehmen seine eigene Sicht auf die Videogenerierung vor. Dies ist eine Plattform, die atemberaubend realistische Videoclips erstellen kann. Es ist in der Lage, hochwertige 1080p-Clips zu erstellen, die über die 60-Sekunden-Grenze von Sora hinausgehen. Zum jetzigen Zeitpunkt sind wir nicht sicher, wann es der Öffentlichkeit zugänglich gemacht wird. Wenn dies jedoch der Fall ist, werden wir mit Sicherheit viele KI-generierte Videos im Internet sehen.

Videofragen für die Google-Suche

Stellen Sie sich diese Funktion als Google Lens für Videos vor. Sie können eine Aufnahme an Google senden und Gemini Fragen zu diesem Video stellen. Die Frage kann sich auf alles darin beziehen. Zwillinge können erkennen, was im Video vor sich geht, und die Frage darauf basierend beantworten.

Google gab während der Google I/O ein Beispiel, bei dem der Moderator Google eine Frage stellte, die auf einem Video eines kaputten Plattenspielers basierte. Gemini konnte feststellen, welcher Teil des Plattentellers kaputt war, und ihr Informationen darüber geben, was zu tun war, um das Problem zu beheben. Diese Funktion entspricht der ursprünglichen Vision von Google, Gemini über Text, Audio, Video und Bilder nachdenken zu lassen.

Die Möglichkeiten mit dieser Funktion sind endlos und Google wird dadurch viel zugänglicher für Leute, die eine Frage nicht richtig eingeben können.

Edelsteine

Diese neue Funktion ist eine großartige Möglichkeit, Ihr Gemini-Erlebnis individuell zu gestalten. Ein Gem ist eine personalisierte Version von Gemini, die Sie für ganz bestimmte Zwecke verwenden können. Wenn Sie beispielsweise eine angepasste Version von Gemini erstellen möchten, die speziell auf die Erstellung von Geistergeschichten abgestimmt ist, können Sie dafür ein Juwel erstellen.

Im Gem-Ersteller können Sie beschreiben, welche Art von Chatbot Sie erstellen möchten. Sie können etwas eingeben wie „Ein Ersteller von Geistergeschichten, der Geschichten mit mysteriösen Charakteren und Wendungen in der Handlung erfindet.“ Wenn Sie das tun, macht sich Gemini an die Arbeit und erstellt den Befehlssatz für diesen Chatbot.

Es geht noch darüber hinaus, da Sie Gemini auch in anderen Google-Produkten Zugriff auf Ihre Dateien gewähren können. Wenn Sie Gemini beispielsweise Zugriff auf Ihre Google Docs gewähren und über Story-Entwürfe von Geistergeschichten verfügen, kann Gemini diese Entwürfe durchlesen, um ein Gefühl dafür zu bekommen, welche Art von Geschichten Sie schreiben möchten.

Sie können mehrere Edelsteine ​​erstellen, sodass Sie sie für unterschiedliche Zwecke verwenden können. Diese Funktion wird später in diesem Jahr eingeführt.

Gemini-betriebener Betrugsanrufdetektor

Dies ist eine praktische Funktion, wenn Sie sich vor Betrug schützen möchten. Wir sind alle daran gewöhnt, Betrugsbenachrichtigungen zu erhalten, sobald ein Anruf eingeht. Einige Anrufe kommen jedoch durch und Google kann Sie während eines Anrufs warnen, wenn es sich um einen Betrug handelt.

Zwillinge können Ihren Anruf mithören und feststellen, ob die Person, die Sie anruft, versucht, Sie auf irgendeine Weise zu betrügen. Wenn Sie beispielsweise von einer Bank angerufen werden und die Bank Sie auffordert, Ihr Geld auf ein sicheres Konto zu überweisen (was Banken NIEMALS tun), kann Gemini diesen Anruf kennzeichnen und Ihnen mitteilen, dass es sich wahrscheinlich um ein Konto handelt Betrug.

Das Tolle daran ist die Tatsache, dass die gesamte Verarbeitung auf dem Gerät erfolgt. Sie müssen sich also keine Sorgen machen, dass Google Ihr Gespräch mithört. Sämtliche Daten bleiben lokal auf Ihrem Gerät gespeichert.

Notebook-LM-Upgrade

Notebook LM ist ein pädagogisches Hilfsmittel, das Kindern beim Lernen und Recherchieren hilft. Es wurde während der Google I/O im Jahr 2023 angekündigt. Jetzt erhält Notebook LM ein ziemlich großes Update.

Diese Funktion wird als Audioübersichten bezeichnet. Es liest das Material durch, das Sie darauf laden, und erstellt darauf basierend eine lehrreiche Diskussion. Die Bildungsdiskussion wird im Podcast-Stil mit zwei Gesprächspartnern stattfinden. Es wird ein echtes Gespräch nachahmen, sodass Kinder sich besser damit identifizieren können.

Darüber hinaus können Sie Änderungen an der Diskussion vorschlagen, und Gemini wird die Änderungen in Echtzeit vornehmen. Wenn Sie beispielsweise eine Diskussion über die Jupitermonde erstellen, diese aber so ändern möchten, dass Basketball-Analogien verwendet werden, können Sie diese eingeben. Danach wird Gemini die Bildungsdiskussion entsprechend umgestalten.

Engere Integration zwischen Workspace-Apps

Derzeit können die Workspace-Anwendungen von Google wie Docs, Sheets, Slides, Gmail usw. miteinander integriert werden. Allerdings verschärft Google diese Integration, und Gemini ist das Laster, mit dem sie verschärft wird. Sie können Gemini bitten, bestimmte Aktionen mit Ihren Dateien innerhalb von Workspace auszuführen.

Wenn Sie beispielsweise möchten, dass Gemini Ihre E-Mails durchsieht, eine Rechnung für eine von Ihnen erbrachte Leistung durchsieht und die Informationen aus dieser Rechnung in ein Google-Dokument einfügt, können Sie dies tun. Das ist nur ein Beispiel für diese enge Integration.