Der Kampf zwischen Google und OpenAI wurde noch intensiver, als Google endlich seine Antwort auf GPT-4 von OpenAI veröffentlichte. Darauf haben wir gewartet, da sich der Start tatsächlich bis Januar 2024 verzögerte. Nun, es sieht so aus, als gäbe es keine Verzögerung, da Google gerade Gemini, sein neuestes multimodales KI-Modell, angekündigt hat.
Google Bard ist bereits ziemlich leistungsfähig, aber das Unternehmen wollte etwas viel Leistungsfähigeres entwickeln. Zu Beginn des generativen KI-Wettlaufs ging es darum, den leistungsstärksten KI-Chatbot zu entwickeln. Allerdings haben sich die Zeiten im Laufe des Jahres seit dem Start von ChatGPT geändert. Alle Unternehmen sind auf der Suche nach dem leistungsfähigsten All-in-One-KI-Modell, das Texte und Bilder erstellen kann.
Werbung
Google hat gerade Gemini angekündigt und es ist ziemlich leistungsstark
Gemini ist ein großer Fortschritt für Googles KI, und es stellt sich nicht nur gegen GPT-4, sondern auch gegen menschliche Gehirne – beängstigend, oder? Google hat Gemini einigen grundlegenden Benchmarks unterzogen, die es mit menschlichem Denken vergleichen, und es konnte Geschichte schreiben. Es ist das erste Modell, das jemals die besten menschlichen Experten im MMLU (Massive Multitask Language Understanding Benchmark) erreichte; es erzielte eine Punktzahl von 90,0 %.
Unten sehen wir eine Tabelle mit acht Benchmarks. Die Tabelle zeigt die Ergebnisse von Gemini im Vergleich zu den GPT-4-Ergebnissen, wobei letzteres unserer Meinung nach in den meisten von ihnen am besten abschneidet.
Der einzige Bereich, in dem es auf das OpenAI-Modell ankam, war der Bereich „logisches Denken bei alltäglichen Aufgaben“. Es erzielte zwar schlechtere Ergebnisse, aber nicht viel. Wir können darauf wetten, dass Zwillinge viel gesunden Menschenverstand haben.
Was können Zwillinge tun?
Der Hauptunterschied zwischen Zwillingen und Barden besteht darin, dass ersterer multimodal ist. Dies bedeutet, dass es verschiedene Medienformen verstehen und Ihnen Ergebnisse liefern kann. Es ist von Grund auf multimodal konzipiert, sodass die Bild-, Text- und Audiomodelle nahtlos kommunizieren, um die relevanteste Antwort zu liefern.
Dies bedeutet auch, dass unterschiedliche Medienformen als Input verwendet werden können. Die meisten Modelle werden nur auf Text trainiert. Nick Clegg, leitender KI-Wissenschaftler bei Meta, erklärte kürzlich bei einer Meta-Veranstaltung: „Text ist eine sehr schlechte Informationsquelle.“ Die Fähigkeit von Zwillingen, so viele verschiedene Formen von Medien zu verstehen, ermöglicht es ihnen, die Welt viel effizienter zu verstehen.
Werbung
Drei Größen passen allen
Gemini gibt es in drei verschiedenen Größen, je nachdem, wofür Sie es verwenden möchten. Die größte Größe wird aufgerufen Zwillinge Ultra, und zwar für die komplexesten und anspruchsvollsten Aufgaben. Sie gehen davon aus, dass Unternehmen auf Unternehmensebene von diesem Modell profitieren werden. Ultra sollte Zugriff auf alle Funktionen des Modells haben.
Als nächstes haben wir Zwillinge Pro. Dies ist der Sweet Spot der drei Ebenen. Sie können also davon ausgehen, dass Sie mit genau der richtigen Anzahl an Kompromissen eine angemessene Leistung erhalten, um das Gewicht ausreichend gering zu halten. Es scheint, dass dies für fortgeschrittene Aufgaben am effektivsten ist. Vielleicht könnten Menschen, die ein Start-up gründen, am meisten davon profitieren.
Schließlich haben wir Zwillinge Nano. Wie der Name schon sagt, handelt es sich um das kleinste und energieeffizienteste Modell. Laut Google ist dies das effizienteste Modell für KI-Aufgaben auf dem Gerät. Tatsächlich wird das Google Pixel 8 Zugriff auf dieses Modell erhalten.
Verfügbarkeit
Dieses multimodale Modell wird über einen mehrstufigen Rollout verfügen. Heute veröffentlicht Google eine „feinabgestimmte“ Version von Gemini Pro für Bard. Dies ist das größte Update für Bard seit seiner Einführung und Benutzer sollten eine Verbesserung im Chatbot feststellen. Dies wird in mehr als 170 Ländern auf Englisch eingeführt.
Ebenfalls heute wird Google Gemini Nano für das Pixel 8 Pro vorstellen. Dadurch wird nur die KI-Leistung des Telefons gesteigert. Bedenken Sie, dass es sich um die Pro-Version des Pixel 8 handelt. Die reguläre Variante wird es nicht schaffen. Sie können jedoch zu einem Pixel 8 Pro greifen, wenn Sie nicht darauf verzichten möchten.
Werbung
Sie werden sehen, dass Gemini in den kommenden Monaten auch bei anderen Diensten wie Search, Duet AI und Chrome Einzug hält. Am 13. Dezember können Entwickler Zugriff auf Gemini Pro erhalten.
Schließlich wird Google irgendwann Anfang nächsten Jahres Gemini Ultra auf den Markt bringen. Das Unternehmen hat uns keinen bestimmten Monat oder Geschäftsquartal genannt. Es gab Gerüchte, dass das Unternehmen das gesamte Gemini-Projekt bis Januar 2024 verschoben hat. Es besteht jedoch die Möglichkeit, dass nur Gemini Ultra verzögert wurde. Auf jeden Fall können wir mit der Einführung von Gemini mit einigen großen Veränderungen in der KI-Landschaft von Google rechnen.