Waymo nutzt Google Gemini für autonome Robotertaxis

Waymo hat angekündigt, Google Gemini AI für seine selbstfahrenden „Robotaxis“ zu verwenden. Das Unternehmen scheint ein neues Trainingsmodell für seine autonomen Fahrzeuge zu entwickeln, das Daten aus Googles Multimodal Large Language Model (MLLM) Gemini nutzen wird.

Waymo veröffentlicht neues Forschungspapier über MLLMs, die Robotaxis unterstützen

Waymo LLC war früher als Google Self-Driving Car Project bekannt. Es ist ein amerikanisches Unternehmen für autonome Fahrtechnologie. Waymo hat nach und nach Hardware und Software für Robotertaxis entwickelt, um Passagiere auf stark befahrenen Straßen sicher zu befördern.

Wie berichtet, hat Waymo ein neues Forschungspapier veröffentlicht Der Rand. Mit dem Titel „Durchgängiges multimodales Modell für autonomes Fahren„oder EMMA, das Forschungspapier bezieht sich auf ein neues MLLM, das sich autonomen Fahrzeugen widmet.

Dieses neue End-to-End-Trainingsmodell würde Sensordaten verarbeiten und „zukünftige Flugbahnen für autonome Fahrzeuge“ generieren. Es versteht sich von selbst, dass dies den fahrerlosen Fahrzeugen von Waymo dabei helfen würde, unterwegs intelligente Entscheidungen zu treffen. Die Waymo-Robotaxis konnte zuverlässig vorhersagen, wohin sie fahren und wie sie Hindernissen ausweichen sollte.

Wie wird Google Gemini Waymo helfen?

Seit mehreren Jahren verwenden Algorithmen für selbstfahrende Fahrzeuge unterteilte Lösungen oder Module, um jede kritische Funktion abzudecken. Mit anderen Worten: Technologieunternehmen versuchten, Aspekte wie Wahrnehmung, Kartierung, Vorhersage und Planung unabhängig voneinander anzugehen.

Ein solcher Ansatz hat dazu beigetragen, Probleme für autonome Fahrzeuge zu lösen. Bei diesem Ansatz hatten Unternehmen jedoch Probleme bei der Skalierung ihrer Lösungen. Dies ist auf „akkumulierte Fehler zwischen Modulen und begrenzte Kommunikation zwischen Modulen“ zurückzuführen, so Waymo in der Forschungsarbeit.

Darüber hinaus führten „vordefinierte“ Parameter dazu, dass solche Lösungen nicht mehr auf „neuartige Umgebungen“ reagierten, da sie Schwierigkeiten hatten, sich „anzupassen“. Googles Gemini ist eine generative künstliche Intelligenz (Gen AI). Es handelt sich um eine „generalistische“ KI, die der Suchriese anhand riesiger Datensätze aus dem Internet trainiert hat.

Zweitens haben Gen-AI-Plattformen durch Techniken wie „Chain-of-Thought Reasoning“ nachweislich „überlegene“ Argumentationsfähigkeiten demonstriert, so Waymo. Einfach ausgedrückt: Zwillinge können das menschliche Denken nachahmen, und daher könnte der LLM wie ein Fahrer „denken“.

Obwohl Google Gemini Waymo helfen könnte, müsste die EMMA-KI immer noch gut mit neuen Daten umgehen können, was autonome Fahrzeuge ständig tun müssen. Konkret hatte EMMA Probleme mit der Integration von 3D-Sensoreingaben von Lidar oder Radar, gab Waymo zu.