Künstliche Intelligenz ist derzeit in einem ziemlich fortgeschrittenen Stadium, aber die Unternehmen, die die Technologie entwickeln, sind noch nicht damit fertig, sie weiter voranzutreiben. Letztes Jahr ging es darum, KI dazu zu bringen, Dinge zu sagen, aber dieses Jahr wollen Unternehmen der KI beibringen, wie man Dinge tut. Das Claude-Modell von Anthropic führt schließlich Aktionen auf Ihrem Computer aus.
Falls Sie nicht wissen, was Anthropic ist: Dies ist das von Google und Amazon unterstützte KI-Unternehmen, das ein leistungsstarkes KI-Modell namens Claude besitzt. Wir beschäftigen uns derzeit mit der Modellfamilie Claude 3.5. Dazu gehören Claude 3.5 Sonett, Claude 3.5 Opus und Claude 3.5 Haiku. Die Nutzung des Sonnet-Modells ist kostenlos. Sie müssen lediglich ein kostenloses Konto erstellen und können dann auf der Website von Anthropic darauf zugreifen.
Claude könnte bald Aktionen auf Ihrem Computer ausführen
Anthropic testet derzeit eine neue Funktion für sein Modell Claude 3.5 Sonnet. Mit dieser Funktion kann das Modell einfache Aktionen auf Ihrem Computer ausführen. Die Funktion „Computernutzung“ ist noch nicht für alle verfügbar. Es ist als öffentliche Betaversion für Benutzer der API verfügbar.
Wenn diese Funktion aktiviert ist, kann Claude einfache Aufgaben auf Ihrem Computer ausführen, z. B. den Bildschirm lesen, den Cursor bewegen, auf Schaltflächen klicken und sogar Text eingeben. Das ist vorerst so ziemlich die Grenze, da das Unternehmen noch daran arbeitet, ihm die Ausführung komplexerer Aufgaben zu ermöglichen. Erwarten Sie also noch nicht, dass Sie Claude Photoshop ein Bild für Sie mitteilen.
Das klingt vielleicht etwas besorgniserregend, aber Anthropic hat einige Sicherheitsvorkehrungen eingebaut, um sicherzustellen, dass Claude nichts tut, was es nicht tun sollte. Beispielsweise ist es Claude nicht gestattet, mit Social-Media-Seiten zu interagieren, wozu auch das Generieren und Verfassen von Beiträgen gehört. Außerdem ist es nicht möglich, auf Regierungswebsites zuzugreifen, sich mit wahlbezogenen Inhalten zu beschäftigen oder Domänennamen zu registrieren. Das sind alles Dinge, die Anthropic in Schwierigkeiten bringen würden.
Wie es funktionieren wird
Claude wird Ihren Bildschirm nicht auf die gleiche Weise beobachten, wie Sie ihn beobachten. Das Modell verarbeitet keinen Live-Video-Feed der Vorgänge auf Ihrem Computer. Vielmehr geht es, ähnlich wie bei der Windows-Rückruffunktion, darum, Schnappschüsse von dem zu machen, was sich auf Ihrem Computer befindet, und sie „zusammenzusetzen“.
Das bedeutet, dass einige Ereignisse auf Ihrem Computer unbemerkt bleiben könnten. Einige Ereignisse können zwischen Screenshots auftreten, z. B. Benachrichtigungen. Es gibt also bestimmte kurzlebige Aktionen auf Ihrem Computer, die Claude entgehen wird.
Es befindet sich noch im Test
Wie bei jedem KI-Tool besteht immer die Möglichkeit, dass es schief geht und Probleme verursacht. Die Entwickler gaben ein Beispiel dafür, wie Claude zufällig Bilder des Yellowstone-Nationalparks nachschlug. Auch wenn das harmlos erscheint, können unregelmäßige Aktionen wie diese schädliche Auswirkungen haben, wenn sich etwas Sensibles auf Ihrem Bildschirm befindet.
Aus diesem Grund testet das Unternehmen diese Funktion aktiv im Betatest. Es geht darum, möglichst viel konstruktives Feedback von den Benutzern zu erhalten, bevor es der Öffentlichkeit zugänglich gemacht wird.
Wir wissen nicht, wann Anthropic plant, diese Funktion der Öffentlichkeit zugänglich zu machen, wie Benutzer sie nutzen können oder ob Anthropic für die Nutzung Gebühren erheben wird. Da es sich hier um eine paradigmenwechselnde Technologie handelt, besteht immer die Möglichkeit einer Paywall.
Es ist der natürliche Fortschritt
Dies sind Neuigkeiten, die Menschen beunruhigen könnten, die befürchten, dass KI zu intelligent wird. Dies ist jedoch nur der natürliche Fortschritt der Technologie. Andere Unternehmen arbeiten an KI-Modellen, die Aktionen ausführen können.
HONOR hat beispielsweise gerade ein Tool vorgestellt, mit dem KI Aufgaben auf Ihrem Telefon ausführen kann, beispielsweise das Bestellen Ihres Kaffees. Motorola entwickelt außerdem LAMs (Large Action Models), mit denen Ihre KI Aktionen auf Ihrem Telefon ausführen kann. Lustigerweise hat Motorola auch das Beispiel angeführt, dass die KI Ihren Kaffee bestellt.