Alles, was Sie wissen müssen

Oscar

OpenAI ist eines der größten KI-Unternehmen der Welt und hat einige der fortschrittlichsten künstlichen Intelligenzen unserer Zeit geprägt. Einige seiner Modelle wie GPT 3.5, GPT-4 und GPT-4 Turbo haben die Möglichkeiten von KI neu definiert und sie zu einem der größten Konkurrenten von Unternehmen wie Google gemacht. Nun, das neueste und beste KI-Modell von OpenAI heißt GPT-4o und ist das bisher leistungsstärkste Modell. Was ist GPT-4o und welche Vorteile kann es Ihnen auf Ihrer KI-Reise bieten?

Um diese Frage zu beantworten, sind wir hier. Wir werden durchgehen, was dieses KI-Modell ist, was es kann, was es nicht kann und weitere Informationen, die Sie vielleicht interessieren. Wir beantworten die wichtigen Fragen und teilen Ihnen mit, ob Sie dies gegenüber anderen Modellen wie Gemini, Claude, Meta AI usw. verwenden sollten.

Wir gehen auf die wichtigsten Fragen ein, die Sie haben könnten. Da es hier jedoch um künstliche Intelligenz geht, gibt es bestimmte Aspekte, auf die wir uns nicht zu sehr einlassen können, da dies den Artikel viel zu lang machen würde. Dazu gehört das Eintauchen in einige wissenschaftliche Erkenntnisse und komplizierte Details des Modells.

Schließlich wird dieser Artikel jedes Mal aktualisiert, wenn GPT-4o eine neue Ergänzung erhält. Schauen Sie also ab und zu vorbei, um zu sehen, was es Neues bei GPT-4o gibt. Lassen Sie uns ohne weitere Umschweife eintauchen.

Was ist GPT-4o?

Wenn Sie die Entwicklung der Modelle von OpenAI verfolgt haben, haben Sie möglicherweise von dem eher unkonventionellen Namensschema Wind bekommen. GPT-4o klingt nicht nach viel, ist aber das bisher leistungsstärkste KI-Modell von OpenAI. Es ist der Nachfolger von GPT-4 Turbo. Wenn Sie also die fortschrittlichsten KI-Tools von OpenAI verwenden, verwenden Sie höchstwahrscheinlich GPT-4o.

Wie erhalte ich Zugriff auf das neue Modell?

Es gibt mehrere Möglichkeiten. Erstens können Sie auf GPT-4o auf dieselbe Weise zugreifen, wie Sie normalerweise auf ChatGPT zugreifen. Sie können direkt auf die ChatGPT-Website gehen oder die dedizierte mobile App verwenden.

Als OpenAI GPT-4o ankündigte, kündigte das Unternehmen auch eine andere Möglichkeit an, auf das Modell zuzugreifen. Es kündigte eine neue Mac OS-Desktopanwendung an. Dadurch wird ChatGPT im Grunde zu einer Art Chat-Assistent auf Ihrem Computer. Sie können es mit einer einfachen Tastenkombination aufrufen und mit einer schwebenden Textleiste interagieren, die angezeigt wird. Darüber hinaus können Sie Bilder eingeben, Screenshots hinzufügen und Bilder mit der nativen Kamera Ihres Geräts zur Eingabe aufnehmen. Zum Zeitpunkt des Verfassens dieses Artikels warten wir noch auf die Veröffentlichung einer Sprachfunktion für die Anwendung. Wir sind uns nicht sicher, wann das landen wird.

Für Windows-Benutzer gibt es zum Zeitpunkt des Schreibens dieses Artikels keine Windows-Anwendung. OpenAI arbeitet jedoch derzeit an einer Windows-Anwendung, die fast dasselbe kann. Das Unternehmen plant, diese irgendwann im Laufe des Jahres 2024 auf den Markt zu bringen, daher müssen Windows-Benutzer dranbleiben.

Eine weitere Möglichkeit, auf GPT-4o zuzugreifen, ist Microsoft Copilot. Wie Sie vielleicht wissen, hat Microsoft stark in OpenAI investiert und das Unternehmen nutzt seine KI-Technologie, um Copilot anzutreiben. Daher werden einige der fortschrittlichsten Funktionen von Copilot höchstwahrscheinlich von GPT-4o unterstützt. Das Unternehmen hat kürzlich die neuen PCs mit Copilot-Antrieb angekündigt und wir sind sicher, dass ein Teil der stark integrierten KI-Technologie auf GPT-4o basiert. Wenn Sie sich also für Copilot von Microsoft und dessen Verbesserung des Windows-Erlebnisses interessieren, dann verwenden Sie höchstwahrscheinlich GPT-4o.

Muss ich mich dafür anmelden?

Nein. Wenn Sie bereits ein OpenAI-Konto haben, müssen Sie einfach auf die ChatGPT-Website gehen, auf das Dropdown-Menü oben auf dem Bildschirm klicken und das Modell auswählen, das Sie verwenden möchten. Wenn GPT-4o in Ihrer Region verfügbar ist, steht es zur Auswahl.

Wenn Sie jedoch kein OpenAI-Konto haben, müssen Sie sich für eines anmelden, um das neue Modell verwenden zu können. Wenn Sie sich für ein OpenAI-Konto anmelden, erhalten Sie außerdem Zugriff auf andere Funktionen, die Kontoinhaber nutzen können, um ein persönlicheres Erlebnis zu erhalten. Sie haben auch einen Chatverlauf, in dem Sie den Rückstand Ihrer Gespräche sehen können.

Bedeutet das „O“ in GPT-4o etwas?

Ja, das „O“ steht für „Omni“. Wir sind sicher, dass OpenAI dies als ein All-in-One-Modell betrachtet, das die meisten Ihrer Anforderungen erfüllen kann.

Ist GPT-4o multimodal?

Ja, das ist es. Mit GPT-4o können Sie klassische textbasierte Eingabeaufforderungen eingeben. Es wird ChatGPT genau wie die anderen Modelle unterstützen. Außerdem kann GPT-4o auch Sprache verstehen. Mit der Sprachfunktion können Sie mit dem Modell sprechen, wie mit jedem digitalen Assistenten.

Darüber hinaus kann GPT-4o auch visuelle Eingaben verstehen. Es verfügt über eine Sichtfunktion, mit der es mithilfe eines Kamerasuchers die Welt erfassen kann, ähnlich wie Google Lens oder der AI Pin. Es kann auch sehen, was auf Ihrem Computerbildschirm angezeigt wird, und Ihnen Informationen basierend auf dem geben, was es sieht.

Sie können GPT-4-Fragen zu dem stellen, was auf Ihrem Bildschirm angezeigt wird, z. B. Text, Bilder, Webseiten usw. Ab Ende Mai 2024 ist diese Funktion nicht mehr verfügbar. Dieser Artikel wird aktualisiert, sobald sie verfügbar ist.

Wie greife ich auf die Vision-Funktion zu?

Eine der aufregendsten Funktionen, die OpenAI zusammen mit GPT-4o angekündigt hat, waren Verbesserungen der Vision-Funktion. Dadurch kann das Modell sehen, was sich derzeit auf Ihrem Bildschirm befindet, und Fragen zu dem, was es sieht, beantworten. Darüber hinaus kommt die Vision-Funktion auch in die mobile Version von ChatGPT.

Das Unternehmen demonstrierte die Fähigkeit von ChatGPT, über den Sucher Ihrer Kamera eine Live-Vorschau der Welt zu sehen. Es wird in der Lage sein, Fragen zu dem, was es beobachtet, zu beantworten.

Während der Ankündigung war es in der Lage, auf einem Blatt Papier geschriebene mathematische Probleme zu identifizieren und der Person bei der Lösung zu helfen. Darüber hinaus war es sogar möglich, in das Gesicht einer Person zu schauen und zu erkennen, welche Emotionen sie empfand. Dies ähnelt Googles Project Astra, das das Unternehmen nur einen Tag nach der Vision-Funktion von OpenAI ankündigte. Es wird also definitiv einige Vergleiche zwischen diesen beiden Funktionen geben.

Gibt es ein Upgrade der Sprachfunktion?

Die Sprachfunktion wurde ziemlich deutlich verbessert. GPT-4o sollte ein viel effizienteres und schnelleres Modell als GPT-4 Turbo sein. Dies macht sich vor allem bei der Sprachfunktion bemerkbar. Als OpenAI die neue Sprachfunktion vorführte, stellten wir fest, dass Benutzer viel schneller Antworten erhielten. Sie können fast ein Echtzeitgespräch mit einer Person simulieren, die Ihnen sofort antwortet.

Es dauerte noch ein oder zwei Sekunden, bis die Antwort kam, aber es war immer noch eine Verbesserung. Auch die Stimme, die Sie in der Antwort hören, ist deutlich verbessert. Ab Ende Mai 2024 wurde die Echtzeit-Sprachübertragung jedoch eingestellt. Derzeit gibt es anhaltende Spannungen zwischen OpenAI und Scarlett Johansson. Die neue Stimme, die enthüllt wurde, ähnelt Scarlett Johanssons Stimme auf erschreckende Weise, und sie drückte ihre Abneigung dagegen aus. Daher befindet sich das Unternehmen derzeit in einem Richtungswechsel.

Was ist das Kontextfenster für GPT-4o?

Wenn es um das Kontextfenster geht, liegt GPT-4o immer noch ziemlich weit hinter dem Rest der Konkurrenz. Derzeit verfügt es über ein Kontextfenster mit 128.000 Token. Das ist das Gleiche wie GPT-4 Turbo. Obwohl dies eine wesentliche Verbesserung gegenüber dem GPT-4-Limit von 8.192 Token darstellt, liegt es immer noch meilenweit hinter dem zurück, was wir von Gemini 1.5 Pro erhalten, das bis zu 1 Million Token erreichen kann. Google testet sogar ein experimentelles Limit von 2 Millionen Token für Gemini 1.5 Pro. OpenAI hat also noch großen Nachholbedarf.

Wie viel kostet die GPT-4o-API pro Million Token?

Während GPT-4o das Kontextfenster von GPT-4 Turbo teilt, teilt es nicht dessen Preis pro Million Token. GPT-4o hat Eingabekosten von 5 USD pro Million Token und Ausgabekosten von 15 USD pro Million Token. Das ist die Hälfte dessen, was Sie bei GPT-4 Turbo bezahlen, das Eingabekosten von 10 USD pro Million Token und Ausgabekosten von 30 USD pro Million Token hat.

Gibt GPT-4o Bilder aus?

Nein. Die wichtigste Bilderzeugungsplattform von OpenAI ist immer noch DALL-E. Es unterstützt jedoch die Bildeingabe.

Wie viele Sprachen unterstützt GPT-4o?

GPT-4o ist in über 50 Sprachen verfügbar.

Was ist der Stichtag für GPT-4o?

Dies ist ein Bereich, in dem GPT-4 Turbo seinem Nachfolger überlegen ist. GPT-4 Turbo hat ein Stichdatum im Dezember 2023. Das bedeutet, dass es keinerlei Wissen über die Welt hat, die nach diesem Datum erschaffen wurde. GPT-4o hingegen endet im Oktober 2023. Das sind also 2 Monate an Daten, auf die das Unternehmen im Vergleich zu seinem Vorgänger keinen Zugriff hat. Wenn Sie GPT-4o außerdem irgendwelche Fragen stellen, wird es nach Oktober 2023 nichts wissen. Es hat also keinerlei Wissen über irgendetwas, das im Jahr 2024 passiert. Das ist etwas, das man im Hinterkopf behalten sollte.

Kann GPT-4o ein Übersetzer sein?

Ja. Eines der Hauptmerkmale, das bei der Vorstellung von GPT-4o vorgestellt wurde, war die Übersetzungsfunktion. Es kann zahlreiche Sprachen in Echtzeit übersetzen. Es kann nicht nur verschiedene Sprachen übersetzen, sondern reagiert auch auf sehr menschliche Weise. Anstatt die Gesprochene Wort für Wort zu übersetzen, gibt es Ihnen eine sehr menschlich klingende Zusammenfassung dessen, was die andere Person gesagt hat.

Wenn ein Italiener fragt: „Wo ist der nächste Starbucks?“, übersetzt GPT-4o diese Frage nicht Wort für Wort. Allerdings wird es eine sehr menschlich klingende Übersetzung geben wie „Er möchte wissen, wo der nächste Starbucks ist.“ Dies wird auf eine Art und Weise übermittelt, die dem ähnelt, was eine Person sagen würde, anstatt Wort für Wort zu übersetzen.

Ist GPT-4o für kostenlose Benutzer verfügbar?

Ja, aber es gibt einen großen Vorbehalt. Kostenlose Benutzer können die Funktionen von GPT-4o nutzen, z. B. im Internet surfen, Erkenntnisse aus Daten analysieren und extrahieren, Bilder in Eingabeaufforderungen hochladen, Supportdateien und Eingabeaufforderungen bereitstellen und GPTs verwenden. Was ist der Vorbehalt? Nun, Sie können diese nur eine begrenzte Anzahl von Malen innerhalb eines Zeitraums von drei Stunden verwenden. Danach werden Sie wieder auf GPT 3.5 zurückgesetzt.

OpenAI benachrichtigt Sie, sobald Sie Ihr Limit erreicht haben, und teilt Ihnen mit, wann Ihr Limit zurückgesetzt wird.

Sind ChatGPT Plus-Benutzer ebenfalls eingeschränkt?

Leider ja. Wenn Sie 20 $/Monat für den Zugriff auf GPT-4o bezahlen, können Sie alle drei Stunden bis zu 80 Nachrichten senden. Sobald Sie dieses Limit erreichen, werden Sie auf ein weniger leistungsfähiges Modell zurückgesetzt. Nach Ablauf der drei Stunden wird Ihr Limit zurückgesetzt.

Wie erreiche ich mit dem Modell ein höheres Limit?

Zum jetzigen Zeitpunkt scheint es keine Möglichkeit zu geben, Ihr Limit zu erhöhen. Wenn Sie sich jedoch in einem ChatGPT-Teamarbeitsbereich befinden, sollten Sie Zugriff auf etwa doppelt so viele Nachrichten haben.

Werden meine nicht genutzten Nachrichten übertragen?

Nein tun sie nicht. Wenn Sie nur 60 Ihrer Nachrichten verwenden und 3 Stunden vergehen, werden die restlichen 20 Nachrichten nicht zu Ihrem aktualisierten Limit hinzugefügt. Sie beginnen wieder bei 80 Nachrichten.

Ist GPT-4o besser als Gemini 1.5 Pro?

Das ist eine ziemlich schwierige Frage, aber GPT-4o hat einiges zu bieten. Während Gemini1.5 Pro über ein viel größeres Kontextfenster verfügt, scheint GPT-4o viel besser zu verstehen und zu argumentieren. Ein Unternehmen führte einen Vergleich zwischen den beiden Modellen durch, bei dem es beiden Modellen bestimmte logische Fragen stellte und sie aufforderte, Bilder zu ermitteln. Insgesamt wurden acht Fragen gestellt. Gemini 1.5 Pro hat GPT-4o in keiner der Fragen geschlagen.

Allerdings hat GPT-4o Gemini bei sechs der acht Fragen geschlagen. Bei den beiden Fragen, bei denen GPT-4o Gemini nicht geschlagen hat, haben beide Modelle eine richtig und eine falsch beantwortet. In Bezug auf Argumentation und Problemlösung scheint GPT-4o Gemini also ziemlich weit voraus zu sein.

GPT-4o in der Zukunft

Derzeit warten wir noch darauf, dass einige Funktionen im neuen Modell enthalten sind. Dazu gehören einige der Sprach- und Bildfunktionen. Wenn Sie also darauf warten, müssen Sie geduldig sein.

Darüber hinaus erwarten wir in den kommenden Monaten eine Reihe typischer Verbesserungen wie bessere Argumentation, schnellere Verarbeitung usw. Wir sind uns nicht sicher, ob dies der nächste Schritt vor GPT-5 sein wird. Das bleibt jedoch abzuwarten.