KI-Unternehmen bemühen sich alle darum, sozusagen „eine bessere Mausefalle zu bauen“. Sie versuchen, KI-Modelle zu entwickeln, die die Menschheit voranbringen (und mehr Menschen dazu bewegen, in sie zu investieren). Unternehmen möchten den perfekten KI-Assistenten entwickeln, der ihnen das Leben erleichtert, und die meisten Menschen kennen das erstaunliche Tool Stream Realtime aus Googles AI Studio nicht.
Android hat die Gemini-App, aber was ist mit Ihrem Computer? Sicher, es gibt Tools, die KI auf den PC bringen, wie den ChatGPT-Desktop-Client und Microsofts Copilot, aber was hat Google? Google verfügt über einige Tools, die Sie auf Ihrem Computer verwenden können, aber Stream Realtime in AI Studio kommt einem vollwertigen KI-Assistenten, der Ihren Computerbildschirm sehen kann, am nächsten.
Was ist also diese Funktion und wie lässt sich dieses KI-Tool am besten nutzen? Finden wir es heraus!
Was ist Stream Realtime in AI Studio?
AI Studio ist eine komplette Plattform, mit der Sie Ihre eigenen KI-Modelle auf Basis von Gemini erstellen können. Wenn Sie ein Modell erstellen möchten, können Sie Ihren API-Schlüssel erhalten und mit der Erstellung beginnen. Wir sind jedoch hier, um eine der Funktionen dieser Plattform zu nutzen.
Das Wichtigste zuerst: Besuchen Sie die offizielle AI Studio-Website und stellen Sie sicher, dass Sie angemeldet sind, falls dies nicht der Fall ist. Sobald Sie angemeldet sind, möchten Sie den Seitenbereich auf der linken Seite des Bildschirms öffnen. Klicken Sie auf die Schaltfläche „Echtzeit streamen“ und Sie sehen einen Popup-Bildschirm mit drei Optionen. Sie können entweder mit Gemini sprechen, ähnlich wie bei Gemini Live, Ihre Webcam einschalten, damit Gemini die Welt sehen kann, oder Gemini Ihren Bildschirm sehen lassen. Um diese Funktion nutzen zu können, müssen Sie sicherstellen, dass Sie Ihrem Browser die Erlaubnis erteilen, auf Ihr Mikrofon und Ihre Kamera zuzugreifen.
Wenn Sie Ihren Bildschirm teilen möchten, müssen Sie die dritte Option auswählen und auswählen, welchen Bildschirm Sie teilen möchten. Sie können das aktuell von Ihnen verwendete Browserfenster freigeben, aber auch auf andere Fenster und andere Anwendungen klicken. Wenn Sie diese Funktion verwenden, greift sie auf Ihr Mikrofon zu und Sie können damit ein Gespräch führen. Es ist, als ob Sie Gemini Live auf Ihrem Computer hätten.
Zu beachten ist, dass das Tool zum Zeitpunkt des Verfassens dieses Artikels Gemini 2.0 Experimental verwenden wird. Sie sollten also damit rechnen, dass im Laufe der Zeit leistungsstärkere Modelle zum Einsatz kommen. Beachten Sie außerdem, dass Stream Realtime separate Fenster auf Ihrem Computer anzeigen kann, nicht jedoch Ihren Desktop. Es können jedoch auch andere Programme als Ihr Browser angezeigt werden.
Wie Stream Realtime das Leben einfacher machen kann
Sie haben also ein leistungsstarkes KI-Tool zur Hand, aber wie geht es weiter? Hier sind einige Möglichkeiten, wie Stream Realtime Ihnen das Leben erleichtern kann.
Navigieren in Ihrem Browser
Dies ist eine Funktion, die möglicherweise besser funktioniert, wenn Sie Chrome verwenden. Gemini verfügt über ziemlich umfassende Chrome-Kenntnisse, Sie müssen Chrome jedoch nicht verwenden. Wir haben dies auch mit Microsoft Edge getestet. Gemini kann das gesamte Browserfenster sehen, sodass alle von Ihnen geöffneten Registerkarten sowie Ihre Lesezeichen angezeigt werden.
Sie können ihm Fragen stellen wie „Wie kann ich meine Lesezeichen organisieren?“ oder „Kann ich Hilfe beim Organisieren meiner Tabs haben?“ Darüber hinaus können Sie nachfragen, wo sich bestimmte Menüs befinden, wenn Sie sie vergessen haben, oder wie Sie auf bestimmte Teile der Benutzeroberfläche zugreifen können. Dies kann auch für andere Browser funktionieren; Sie sollten jedoch sicherstellen, dass Sie einen gängigeren Browser wie Edge oder Firefox verwenden.
Dein Hausaufgaben-Kumpel
Wenn Sie an einer Schulaufgabe arbeiten, können Sie das AI Studio aufrufen und die Option zur Bildschirmfreigabe wählen. Es wird in der Lage sein, auf Ihrem Bildschirm zu sehen, welche Probleme Sie haben. Da Ihr Mikrofon verwendet wird, können Sie sich hin und her über das Problem unterhalten, das Sie lösen möchten. Die KI wird in der Lage sein, zu verstehen, was bei dem Problem vor sich geht, und Sie durch die Lösung führen.
Das Besondere an der modernen generativen KI ist, dass Sie in einem natürlichen Ton mit ihr sprechen können, also haben Sie keine Angst, etwas zu sagen wie „Ich versuche herauszufinden, wie man dieses Problem berechnet, aber ich habe einiges davon vergessen.“ die ersten Schritte, die ich gehen muss. Helfen Sie mir, aber geben Sie mir nicht die Antwort.“ Sagen Sie ihm unbedingt, dass er Ihnen die Antwort nicht geben soll, wenn Sie das nicht möchten, denn in unseren Tests würde er das Problem einfach durchgehen und Ihnen die Antwort geben.
Es gibt etwas zu beachten; Sie müssen Ihre Arbeit noch einmal überprüfen. Es kam ein paar Mal vor, dass Zwillinge die Antworten auf die Fragen völlig falsch beantworteten. Es wurde eine Aufgabe von 537 + 426 gestellt und die Antwort lautete 1.063. Es ist besser, danach zu fragen, um die richtige Antwort zu finden, als die Antwort auf Ihre Frage aufzuschreiben.
Es ist nicht nur in der Lage, mathematische Probleme zu lösen. Zwillinge haben im letzten Jahr Fortschritte gemacht und sind ziemlich gut darin geworden, Probleme zu lösen. Sie können also davon ausgehen, dass sie Ihnen bei Ihren Schularbeiten helfen können, egal um welches Fach es sich handelt. Es kann ein großartiger Nachhilfelehrer sein, der Ihnen dabei hilft, durchzukommen.
Ihr Co-Autor
Da Gemini über eine Live-Ansicht Ihres Bildschirms verfügt, können Sie damit einige Story-Ideen umsetzen. Sie führen ein 1:1-Gespräch mit ihm, als wäre es ein anderer Mensch. Wir raten Ihnen davon ab, Gemini eine Geschichte für Sie erstellen zu lassen. Sie können es jedoch jederzeit zur Erweiterung Ihres Schreibens verwenden.
Sie können beispielsweise nach Ideen fragen, wie Sie Ihre Geschichte weiterentwickeln können oder welche Vorschläge sie enthält. Auch hier können Sie mit Zwillingen sehr gesprächig sprechen, sodass Sie sich entspannen und so tun können, als würden Sie nur mit Ihrem besten Freund chatten. Beim Testen haben wir ein ziemlich kitschiges Märchen über einen erfunden gemeine Prinzessin, die von einer Hexe so geheilt wird, dass ihre Haut eiskalt ist. Sie muss jemanden finden, in den sie sich verlieben kann, um den Zauber zu brechen. Abgesehen davon, dass Disney um eine Klage gebettelt hat, ist diese Geschichte einzig und allein aus dem Gerede und dem Hin- und Herwerfen von Ideen entstanden.
Das Schöne daran ist, dass Zwillinge sehen können, was auf Ihrem Bildschirm angezeigt wird. Angenommen, Sie möchten einen Entwurf einer Geschichte erstellen. Zwillinge können es betrachten und etwas Kontext gewinnen. Sie müssen nur wissen, dass nur das angezeigt wird, was auf dem Bildschirm angezeigt wird. Wenn Ihre Geschichte also mehrere Seiten lang ist, wird sie nicht so effektiv sein. Sie werden jedoch live beim Tippen dabei sein, sodass immer die aktuellsten Informationen verfügbar sind.
Hilfe bei der Fotobearbeitung
Eine KI, die auf Ihren Computerbildschirm schauen kann, ist (unter anderem) hilfreich, wenn es um die Bearbeitung von Fotos geht. Sie können der KI Fragen dazu stellen, wie Sie das Bild bearbeiten möchten. Die KI gibt Ihnen Ratschläge und sagt Ihnen, welche Tools Sie verwenden könnten.
Sie können zum Beispiel Dinge sagen wie „Ich möchte dieses Bild dramatischer machen“. Dann wird es mit Ihnen zusammenarbeiten, bis Sie mit Ihrem Bild zufrieden sind. Da die Verarbeitung in Echtzeit erfolgt, hilft es Ihnen bei der Bearbeitung des Fotos.
Stream Realtime ist ein großartiges Tool
Auch wenn Stream Realtime nicht die Art von Assistent ist, der in die Software Ihres Computers eindringen und in Ihrem Namen Aktionen ausführen kann, ist es dennoch ein großartiges Tool, wenn Sie Unterstützung bei Ihren alltäglichen Aufgaben benötigen. Es gibt Ihnen einen Vorgeschmack darauf, was Google und andere Unternehmen mit KI erreichen wollen.