Google hat eine erweiterte Version seines Gemini Deep Research-Agenten eingeführt. Der Umzug erfolgt ungefähr zeitgleich mit der Veröffentlichung des GPT 5.2 AI-Modells von OpenAI. Diese Version basiert auf den Funktionen von Gemini 3 Pro und zielt auf komplexe, mehrstufige Untersuchungen und Informationssynthese ab. Der Schwerpunkt liegt zunächst auf Entwicklern und in Kürze auf Verbraucheranwendungen.
Der Agent ist für die Verwaltung von Aufgaben konzipiert, die das Sammeln und Synthetisieren großer Mengen an Kontext über lange Zeiträume erfordern. Es arbeitet mit einem autonomen Denkkern, der seine eigene Untersuchung plant. Nach Erhalt einer Aufforderung formuliert der Agent iterativ Abfragen, liest die Ergebnisse, identifiziert etwaige Wissenslücken in den gesammelten Informationen und führt eine erneute Suche durch. Dieser selbstgesteuerte Prozess ermöglicht es dem System, komplexe Datenlandschaften mit erhöhter Genauigkeit zu navigieren.
Google vs. OpenAI: Der aktualisierte Deep Research-Agent von Gemini stellt GPT-5.2 in puncto Genauigkeit in Frage
Das Hauptziel dieses Upgrades besteht darin, das Risiko zu reduzieren. Google hat den Deep Research-Agenten speziell darauf trainiert, die Anzahl der KI-Halluzinationen zu reduzieren. Dadurch sollte die Menge an falschen Informationen, die das Modell generiert, reduziert werden. Bei Deep-Argument-Aufgaben, bei denen selbst ein kleiner Fehler zu Beginn einer mehrstufigen Untersuchung den Abschlussbericht unbrauchbar machen kann, ist ein hohes Maß an sachlicher Genauigkeit von entscheidender Bedeutung.
Google bestätigte die Leistung des Agenten durch die Veröffentlichung überzeugender Ergebnisse bei Benchmarks für fortgeschrittenes Argumentieren. Dazu gehören Humanity’s Last Exam (HLE), das Allgemeinwissen und komplexes Denken misst, und der Open-Source-Benchmark DeepSearchQA, der von Google selbst entwickelt wurde, um umfassende, mehrstufige Webrecherchen zu bewerten.
Die hohe Präzision dieser Technologie ist bereits in anspruchsvollen Bereichen vorhanden. Erste Tests zeigen, dass das Mittel im Finanzdienstleistungsbereich wirksam ist, wo es die ersten, arbeitsintensiven Phasen der Due Diligence automatisieren kann, und in der Biotechnologie, wo es durch die Analyse umfangreicher biomedizinischer Literatur zur Beschleunigung der Arzneimittelsicherheitsforschung beiträgt.
Integration und Zugänglichkeit
Um die externe Entwicklung zu erleichtern, hat Google gleichzeitig die neue Interactions API eingeführt. Dies ist eine einheitliche Schnittstelle für Entwickler, um mit den Gemini-Modellen zu arbeiten und den Deep Research-Agenten direkt in ihre Anwendungen zu integrieren. Der Schritt beschleunigt die Fähigkeit Dritter, maßgeschneiderte, KI-gestützte Forschungstools zu entwickeln.
Für Verbraucher plant Google, die Fähigkeiten des Deep Research-Agenten in seine Flaggschiffdienste zu integrieren. Die Liste umfasst die Haupt-Gemini-App, Google Search, und ihre Forschungsanwendung, NotebookLM. Das Ergebnis sollte sein, dass die KI die vorbereitende schwere Arbeit der Recherche übernimmt und die Art und Weise verändert, wie Benutzer online mit Informationen interagieren.