Flaggschiff-KI-Leistung zum günstigen Preis

Oscar

Die KI-Branche bewegt sich in einem Tempo, das anstrengend sein kann, aber der jüngste Schritt von Anthropic ist schwer zu ignorieren. Nur zwölf Tage nach der Einführung seines leistungsstarken Modells Claude Opus 4.6 hat das Unternehmen Claude Sonnet 4.6 veröffentlicht. Dieses neue Mittelklassemodell soll etwas Bemerkenswertes leisten: Informationen auf „Opus-Niveau“ zu einem Bruchteil der Kosten liefern.

Claude Sonnet 4.6 bietet Leistung auf Flaggschiff-Niveau

In der Welt der KI gab es schon immer einen Kompromiss. Wenn Sie ein Modell wollten, das komplexe Schlussfolgerungen und fehlerfreie Codierung ermöglicht, mussten Sie für Modelle der „Opus-Klasse“ einen Aufpreis zahlen. Wenn Sie etwas günstigeres wollten, mussten Sie sich mit weniger „Gehirnleistung“ zufrieden geben.

Claude Sonnet 4.6 wurde entwickelt, um diesen Kompromiss effektiv zu beseitigen. Anthropic hat den Preis trotz des massiven Leistungssprungs bei 3 US-Dollar pro Million Input-Tokens belassen – genau wie bei der Vorgängerversion. Um das ins rechte Licht zu rücken: Der Betrieb eines leistungsstarken KI-Agenten ist heute etwa fünfmal günstiger als noch vor wenigen Wochen. Für Unternehmen, die täglich Millionen automatisierter Aufgaben ausführen, ist das eine große Sache.

Besser darin, „menschlich zu sein“ (am Computer)

Einer der beeindruckendsten Sprünge in dieser Version ist die „Computernutzung“. Dabei handelt es sich um die Fähigkeit einer KI, auf einen Bildschirm zu schauen, einen Cursor zu bewegen und in Apps etwas zu tippen, so wie es ein Mensch tun würde. Als Anthropic dies Ende 2024 zum ersten Mal vorführte, war es experimentell und etwas klobig.

Nach Angaben des Unternehmens hat Sonnet 4.6 ein nahezu menschliches Leistungsniveau erreicht. In Benchmarks, die testen sollen, wie gut KI in Web- und Desktop-Apps navigieren kann, erreichte es 72,5 %, ein deutlicher Sprung gegenüber den 61,4 % seines Vorgängers. Mittlerweile ist es so gut im Umgang mit einem Computer, dass es praktisch mit dem viel teureren Flaggschiff Opus 4.6 mithalten kann. Dies ist ein Wendepunkt bei der Automatisierung von „Legacy“-Aufgaben – den alten Datenbanken und Versicherungsportalen, die nicht über moderne APIs verfügen.

Der neue König des Programmierens?

Für Entwickler ist Claude bereits zu einem beliebten technischen Tool geworden, und Sonnet 4.6 untermauert diesen Ruf. Bei Tests in der Praxis bevorzugten die Entwickler die Ausgaben in 70 % der Fälle gegenüber früheren Versionen. Berichten zufolge ist es weniger anfällig für „Faulheit“ und folgt komplexen, mehrstufigen Anweisungen mit viel höherer Konsistenz.

Das Modell zeigte, dass es nicht nur Code schreiben kann, sondern auch „langfristig denken“ kann. In einem simulierten Geschäftswettbewerb namens „Vending-Bench“ leitete die KI ein Unternehmen ein ganzes simuliertes Jahr lang. Das Unternehmen entwickelte die Strategie, in den ersten zehn Monaten stark in den Kapazitätsaufbau zu investieren, bevor es auf Gewinnmaximierung umstellte. Es schloss die Simulation mit mehr als dem Doppelten der Bilanz früherer Modelle ab und bewies damit, dass es über Monate und nicht nur über Minuten planen kann.

Konkurrenten wie Google und OpenAI weisen unvorhersehbare Veröffentlichungstermine und Verzögerungen auf. Unterdessen hält Anthropic an einem stabilen, viermonatigen Update-Zyklus fest. Diese Konsistenz ermöglicht es CTOs und Entwicklern, ihre Roadmaps mit der Gewissheit zu planen, dass immer ein besseres, effizienteres Modell unmittelbar bevorsteht. Anthropic kann dies als Wettbewerbsvorteil für den Unternehmensmarkt nutzen.

Claude Sonnet 4.6 ist jetzt die Standardversion für alle – auch für diejenigen im kostenlosen Kontingent.