Mit diesen neuen Funktionen kann Gemini Ihren Bildschirm anzeigen

Seit seiner Einführung ist Google Gemini immer intelligenter geworden. Die dedizierte App bringt den leistungsstarken Chatbot auf Ihr Telefon und Google hat gerade zwei neue Funktionen eingeführt, die es noch besser machen. Google hat die Funktionen „Fragen zu diesem Bildschirm“ und „Fragen zu diesem Video“ für Gemini eingeführt.

Die Gemini-App kann kostenlos heruntergeladen werden und ist inzwischen auch für Tablets verfügbar. Damit haben Sie die Leistung von Gemini direkt auf Ihrem Telefon. Wenn Sie Gemini als Sprachassistenten verwenden möchten, können Sie es als Ihren Assistenten festlegen. Laden Sie die App unbedingt herunter, wenn Sie an ihren Funktionen interessiert sind.

Google führt die Funktion „Nach diesem Bildschirm fragen“ ein

Spulen wir zurück ins Jahr 2015. Google stellte damals eine revolutionäre neue Funktion namens Google Now On Tap vor. Wenn Sie sich daran erinnern, waren Sie wahrscheinlich genauso begeistert wie wir alle. Mit dieser Funktion konnte Google Ihren Bildschirm betrachten und den Kontext dessen lesen, was darauf angezeigt wird.

Natürlich ist diese Funktion gekommen und gegangen, aber die Mentalität lebte mit Google Lens weiter. Nun, es sieht so aus, als hätte Google nach neun Jahren harter Arbeit diese Traumfunktion endlich verwirklicht, aber der Name ist nicht mehr eingängig. Heute hat Google damit begonnen, die Funktion mit dem Namen „Nach diesem Bildschirm fragen“ einzuführen.

Obwohl der Name nicht so leicht über die Lippen geht, ist die Bedienung ziemlich einfach und intuitiv. Wie der Name schon sagt, können Sie Gemini fragen, was gerade auf Ihrem Bildschirm angezeigt wird, wenn Sie es aufrufen. Im Grunde erleichtert es die Verwendung einer der nützlichsten Funktionen von Google Lens. Sie können Screenshots machen, diese in Google Lens importieren und es vorlesen lassen, was darin enthalten ist. Wenn Sie „Nach diesem Bildschirm fragen“ verwenden, macht Gemini den Screenshot und analysiert ihn für Sie, sodass kein Mittelsmann erforderlich ist.

Nachdem Sie Gemini herbeigerufen haben, wird die Aktionsschaltfläche über dem Textfeld angezeigt, sodass Sie sie weder eintippen noch sagen müssen. Das macht die Funktion viel praktischer. Die Schaltfläche wird angezeigt, egal welchen Bildschirm oder welche App Sie verwenden. Die einzige Ausnahme ist, wenn Sie auf YouTube sind.

In klassischer KI-Chatbot-Manier gibt Ihnen Gemini eine ausführliche Erklärung dessen, was auf dem Bildschirm angezeigt wird. Angenommen, Sie sehen in den sozialen Medien ein Bild einer bestimmten Blume, und der Beitrag gibt Ihnen keinen Kontext dazu, was es ist. Sie können Gemini aufrufen, um zu scannen, was auf Ihrem Bildschirm angezeigt wird, und Ihnen zu sagen, was es ist.

Es gibt auch Fragen zu diesem Video

Die andere Funktion, die Google vorgestellt hat, ist speziell auf YouTube ausgerichtet. Google sieht sich nicht das gesamte Video im Handumdrehen an und erklärt Ihnen Schritt für Schritt, worum es geht. Es extrahiert Informationen über das Video, beispielsweise die Untertitel. Wenn das Video keine Untertitel hat, funktioniert die Funktion tatsächlich nicht.

Diese beiden Funktionen finden ihren Weg zu den Benutzern, und es scheint nicht so, als ob Google sie in den Pixel-Telefonen als Geisel hält. Sie wurden in Version 15.33.38.28 der App entdeckt.

Verwenden der Funktion

Die Funktion funktioniert bei meinen Tests gut. Allerdings muss man eine App verwenden, damit sie funktioniert, sodass sie nicht auf dem Startbildschirm angezeigt wird. Mit System-Apps wie den Einstellungen funktioniert sie jedoch.

Was die Geschwindigkeit angeht, ist es sehr schnell. Das gilt auch für die Videoanalyse. Ich konnte mir in nur wenigen Sekunden einen vollständigen Überblick über das Video verschaffen und finde das wirklich beeindruckend. Außerdem gefällt mir, dass man zu dem, was man gerade sieht, weitere Fragen stellen kann.

Ich habe nur eine kleine Beschwerde zu dieser Funktion. Erstens muss man, nachdem man die Taste gedrückt hat, die Mikrofontaste drücken, um mit dem Sprechen zu beginnen. Es wäre schön, wenn das Mikrofon sofort aktiviert wäre, damit man sofort mit dem Sprechen beginnen könnte. Auf diese Weise müssen die Leute, die gerade sprechen, keinen zusätzlichen Schritt machen. Leute, die tippen, interagieren sowieso mit dem Bildschirm, sodass ein zusätzliches Tippen das Erlebnis nicht wirklich beeinträchtigt.