Das Claude Sonnet 4.5 von Anthropic kann bis zu 30 Stunden gerade codieren

Oscar

Die KI -Landschaft setzt ihr schnelles Wachstum mit dem Start von Claude Sonnet 4.5 fort, dem neuesten Mainstream -Großsprachmodell von Anthropic. Das Unternehmen hat einen mutigen Anspruch erhoben und das neue Modell als „bestes Codierungsmodell der Welt“ bezeichnet. Eines der größten Highlights ist die Fähigkeit, Nonstop für bis zu 30 Stunden zu codieren.

Claude Sonnet 4.5 kommt nur wenige Monate nach seinem Vorgänger Sonnet 4 an. Es zeigt jedoch einen signifikanten Sprung in der Fähigkeit, insbesondere für Entwickler. Das Modell bewertet 77,2% für den verifizierten Benchmark von SWE-Bench. Letzteres testet die Fähigkeit einer KI, mit Github-Anfragen mit echtem Worten umzugehen. Mit dieser Punktzahl können Sonnet 4.5 konkurrierende Modelle von OpenAI und Google in Codierungsaufgaben übertreffen.

Darüber hinaus führt das Modell nun den OsWorld-Benchmark-ein Test zur Messung der realen Computernutzungsaufgaben-mit einer Erfolgsrate von 61,4%an. Dies ist ein erheblicher Anstieg der früheren Versionen von Claude.

Das Claude -Sonnet von Anthropic 4.5: Der Agent der Ausdauer

Was Sonett 4.5 wirklich von seinem Wettbewerb und früheren Claude -Modellen unterscheidet, ist seine Fähigkeit für anhaltende Arbeit. Anthropische Berichte, dass das Modell jetzt bis zu 30 Stunden autonom ausgeführt werden kann, wobei der Fokus und die Leistung durchgehend aufrechterhalten werden können. Dies ist eine dramatische Erhöhung gegenüber der siebenstündigen Grenze im vorherigen Flaggschiff Claude Opus 4.

https://www.youtube.com/watch?v=oxfvkbb7mcg

Diese Ausdauer verwandelt das Modell von einem einfachen Assistenten in einen fähigen Agenten. In frühen Versuchen hat Sonnet 4.5 Berichten zufolge die Möglichkeit gezeigt, mehr als nur eine Anwendung zu schreiben. Es könnte auch komplexe, mehrstufige Projekte wie die Bereitstellung von Datenbankdiensten ausführen. Es registrierte Domainnamen und führte sogar Soc 2 -Sicherheitsdienste durch – alles ohne menschliche Aufsicht.

Um diese Verschiebung in Richtung Autonomie zu unterstützen, hat Anthropic den Modellzugriff auf neue Funktionen gewährt. Die Liste enthält virtuelle Maschinen und Speicher sowie eine bessere Kontextverwaltung für langjährige Prozesse.

Ein Ökosystem für KI -Agenten

Über das Kernmodell -Update hinaus führte Anthropic mehrere Tools ein, die Entwickler mit Claude befähigen sollen:

Claude Code Updates: Der dedizierte Codierungsagent von Anthropic erhält das Sonnet 4.5 -Modell. Zu den neuen Funktionen gehören eine Visual Studio-Code-Erweiterung zum Anzeigen von Änderungen in Echtzeit, eine verbesserte Statussichtbarkeit im Terminal und Kontrollpunkte, mit denen Benutzer Codesänderungen problemlos zurückrollen können, wenn das Modell Fehler macht.

Claude Agent SDK: Entwickler können jetzt ihre eigenen KI -Agenten mit derselben Kerninfrastruktur erstellen, die den Claude -Code versorgt. Das SDK enthält Tools für Agent Orchestration, Speicher und Verwaltung des Kontextes über erweiterte Aufgaben.

Stellen Sie sich mit Claude vor: Anthropic hat dieses temporäre High-End-Experiment gestartet, um die Fähigkeiten des Modells zu präsentieren. Es ermöglicht MAX -Abonnenten, mit Claude zu interagieren, da es im laufenden Fliegen Software- und Benutzeroberflächen generiert, ohne dass Code oder vorbestimmte Funktionen.

Anthropic behauptet, dass Sonnet 4.5 sein bisher am meisten ausgerichteter Modell ist. Es verfügt über wichtige Sicherheitsverbesserungen, die dazu dienen, prompte Injektionsangriffen zu widerstehen und sich in Bezug auf Verhaltensweisen wie die Sykophanz zu verringern. Sonnet 4.5 ist über die Claude -API und die Claude.ai -Web -App zugänglich, wobei die Preise mit dem vorherigen Sonnet 4 -Modell übereinstimmen.

https://www.youtube.com/watch?v=oz-alrj0ovg