OpenAI stellt sein leistungsstärkstes Argumentationsmodell namens o3 vor

OpenAI hat gerade seine 12-tägige Veranstaltung namens „Shipmas“ abgeschlossen, bei der es einige erstaunliche Ankündigungen gemacht hat. Als gebührenden Abschied stellte uns OpenAI o3 vor, sein kommendes Argumentationsmodell, und es sieht so aus, als ob es äußerst intelligent sein wird.

Während der Shipmas kündigte OpenAI einige weitere tolle KI-Goodies an. Zunächst einmal wurde der ChatGPT Pro-Plan für 200 US-Dollar pro Monat eingeführt. Dadurch erhalten Benutzer Zugriff auf die leistungsstärkste Version von o1 und andere großartige Funktionen. Außerdem veröffentlichte das Unternehmen Sora, seinen KI-Videogenerator, der das Internet praktisch zum Erliegen brachte, als das Unternehmen ihn zum ersten Mal vorstellte. Sie können es verwenden, wenn Sie ChatGPT Plus-Mitglied sind.

OpenAI gibt uns einen kleinen Einblick in o3, sein neuestes Argumentationsmodell

Was ist mit o2 passiert? Nun, es ist zusammen mit Windows 9, dem OnePlus 4 und dem iPhone 9 im Farm-Up-State. OpenAI hat sich entschieden, zu o3 zu wechseln, weil es ein britisches Telekommunikationsunternehmen namens O2 gibt. Dies war also eine Möglichkeit, spätere rechtliche Probleme zu vermeiden.

o3 wird ein Argumentationsmodell sein, das einem regulären Modell ähnelt. Der wesentliche Unterschied besteht jedoch darin, dass ein Argumentationsmodell Ihnen nicht die gesamte Antwort auf einmal liefert, sondern den Prozess tatsächlich aufschlüsselt und Ihnen alle Schritte zeigt, die nötig waren, um zu der Schlussfolgerung zu gelangen. Googles Gemini 2.0 Flash Thinking ist ein gutes Beispiel für ein Argumentationsmodell. Wenn Sie also genauer untersuchen möchten, wie ein Modell zu seiner Antwort gelangt ist, sollten Sie Argumentationsmodelle verwenden.

Da dies das Hauptwerk von OpenAI sein wird, wissen Sie, dass es mit einigen wahnsinnigen KI-Intelligenzen ausgestattet sein wird. Das Unternehmen hat einige Statistiken zu seiner Leistung veröffentlicht, die zeigen, dass es weit über den Punkt hinausgeht, eine KI zu entwickeln, die intelligenter ist als ein Mensch (na ja, meistens).

Beispielsweise unterzog das Unternehmen das Modell den SWE-Bench Verified-Codierungstests und übertraf o1 um 22,8 %. Als nächstes unterzog OpenAI o3 den GPQA (Google-Proof Q&A Benchmark) Diamond Science Benchmark und erzielte eine Punktzahl von 87,7 %. OpenAI hat o3 auch der AIME (American Invitiational Mathematics Examination) unterzogen und nur eine der 15 Fragen nicht beantwortet. Der AIME ist ein extrem schwieriger Mathematikwettbewerb.

Es sieht so aus, als hätte sich OpenAI dieses Mal wirklich selbst übertroffen. Wir wissen nicht, wann das Unternehmen dieses Modell der Öffentlichkeit zugänglich machen wird. Rechnen Sie aber nicht so schnell damit, denn o1 ist noch ziemlich neu.