Benchmark zeigt KI -passende Experten

So sehr wir es auch hassen würden, es zuzugeben, es besteht eine ausgeprägte Möglichkeit, dass KI eines Tages unsere Arbeit übernehmen könnte. Wir sehen dies bereits, insbesondere im Grafikbereich, in dem Benutzer problemlos ein professionelles Bild mit ein paar einfachen Eingabeaufforderungen generieren können. Aber wie schnell können wir erwarten, dass KI uns wirklich im Arbeitsbereich ersetzt? Das ist etwas, das Openai in einem kürzlich durchgeführten Benchmark entdecken wollte, um zu sehen, wie gut sein GPT-5-Modell menschliche Jobs macht.

OpenAI-Benchmarks GPT-5 gegen menschliche Jobs

Dieser neue Benchmark heißt GDPVAL. Laut OpenAI misst es KI-Modelle wie GPT-5 bei Aufgaben, die ein Mensch bei ihrer Arbeit erledigen könnte. “Es misst die Modellleistung bei Aufgaben, die direkt aus der realen Wissensarbeit erfahrener Fachkräfte in einer Vielzahl von Berufen und Sektoren gezogen wurden, und liefert ein klareres Bild darüber, wie Modelle wirtschaftlich wertvolle Aufgaben erbringen. ““

Derzeit basiert GDPVAL auf neun Branchen, die am meisten zum Amerikas BIP beitragen. Dies umfasst Gesundheitswesen, Finanzen, Fertigung und Regierung, um nur einige zu nennen. In einem der Tests forderte OpenAI Branchenfachleute auf, Berichte zu vergleichen, die von AI und anderen von anderen Fachleuten erstellt wurden. Außerdem wurden Investmentbanker gebeten, eine Konkurrenzlandschaft für die Last-Mile-Lieferbranche zu erstellen und sie mit Berichten von AI-Generierten zu vergleichen.

Überraschend und etwas besorgniserregend, das GPT-5-Modell von OpenAI hat das Beste aus allen Modellen des Unternehmens herausgegeben. OpenAI stellte fest, dass die von GPT-5 erzeugten Arbeiten entweder besser eingestuft wurden oder mit Branchenexperten in 40,6% der Fälle entspricht. Das Unternehmen warf seinen Konkurrenten, Anthropic und sein Claude AI -Modell auch einen Blick auf. Claude schien mit einer Gewinnrate von 49% besser zu funktionieren. Openai glaubt jedoch, dass es so ist, dass Claude besser zu machen ist “angenehme Grafiken. ““

Wird dies den Menschen bei ihrer Arbeit ersetzen?

Wie wir sagten, besteht die Möglichkeit, dass einige Jobs irgendwann den Weg des Dinosauriers gehen könnten. Im Moment scheint es jedoch, dass wir uns in einer übergangsspanne befinden. OpenAs Chief Economist Dr. Aaron Chatterji vorschlägt vor, dass es nicht darum geht, Menschen zu ersetzen. Aber es geht darum, dass Menschen die KI nutzen, um Zeit für sinnvollere Aufgaben zu befreien.

Beispielsweise müssen Sie bei Ihrem Job Berichte basierend auf Daten eingeben. Anstatt Stunden zu formatieren, kann AI die Arbeit in Minuten für Sie erledigen. Dies würde Zeit für Sie freigeben, um für andere oder sogar persönliche Aufgaben für andere Aufgaben auszugeben. Klingt nach einem fairen Kompromiss.