- Gemini Robotics ist ein neues Modell
- Es konzentriert sich auf die physische Welt und wird von Robotern verwendet
- Es ist visuell, interaktiv und allgemein
Google Gemini ist gut in vielen Dingen, die in einem Bildschirm passieren, einschließlich generativer Text und Bilder. Dennoch ist das neueste Modell, Google Robotics, ein Vision Language Action -Modell, das die generative KI in die physische Welt verschiebt und die Rasse der humanoiden Roboterrevolution erheblich beschleunigen kann.
Gemini Robotics, welche Google’s Deepmind wurde am Mittwoch vorgestelltverbessert die Fähigkeiten von Gemini in drei Schlüsselbereichen:
- Geschicklichkeit
- Interaktivität
- Verallgemeinerung
Jeder dieser drei Aspekte wirkt sich erheblich auf den Erfolg der Robotik am Arbeitsplatz und den unbekannten Umgebungen aus.
Die Verallgemeinerung ermöglicht es einem Roboter, Geminis umfangreiches Wissen über die Welt und die Dinge aufzunehmen, ihn auf neue Situationen anzuwenden und Aufgaben zu erledigen, auf denen es nie geschult wurde. In einem Video zeigen Forscher ein Paar Roboterarme, die von Gemini Robotics, einem Tisch-Basketball-Spiel, kontrolliert werden, und bitten es, “den Basketball Dunk Dunk Dunk” zu bitten.
Obwohl der Roboter das Spiel zuvor noch nicht gesehen hatte, nahm es den kleinen orangefarbenen Ball auf und stopfte es durch das Plastiknetz.
Google Gemini Robotics macht Roboter auch interaktiver und in der Lage, nicht nur auf ändernde verbale Aufgaben, sondern auch auf unvorhersehbare Bedingungen zu reagieren.
In einem anderen Video baten die Forscher den Roboter, Trauben in eine Schüssel mit Bananen zu stecken, aber dann bewegten sie die Schüssel, während der Roboter Arm Eingestellt und dennoch geschafft, die Trauben in eine Schüssel zu stecken.

Achten Sie weiter
Google demonstrierte auch die geschickten Fähigkeiten des Roboters, mit denen er Dinge wie das Spielen von Tic-Tac-Toe auf einem Holzbrett, das Löschen eines Whiteboards und das Klapppapier in Origami in Angriff genommen hat.
Anstelle von Stunden des Trainings für jede Aufgabe reagieren die Roboter auf nahezu konstante Anweisungen für natürliche Sprache und führen die Aufgaben ohne Anleitung aus. Es ist beeindruckend zu sehen.
Natürlich ist es nicht neu, KI zu Robotik hinzuzufügen.
Letztes Jahr, Openai hat sich mit Figur AI zusammengetan Entwickeln eines humanoiden Roboters, der Aufgaben erarbeiten kann, die auf verbalen Anweisungen basieren. Wie bei der Gemini -Robotik funktioniert das visuelle Sprachmodell von Abbildung 01 mit dem Openai Sprachmodell für Hin- und Her-Gespräche über Aufgaben und sich ändernde Prioritäten.
In der Demo steht der humanoide Roboter vor Geschirr und ein Abfluss. Es wird gefragt, was es sieht, was es auflistet, aber dann ändert der Gesprächspartner Aufgaben und bittet um etwas zu essen. Ohne einen Beat zu verpassen, nimmt der Roboter eine auf Apfel und gibt es ihm.
Während das meiste, was Google in den Videos zeigte, körperlosen Roboterarmen und Händen, die eine Vielzahl von physischen Aufgaben erarbeiten, gibt es grangierende Pläne. Google arbeitet mit einer Partnerschaft mit Apptroniks das neue Modell zu seinem Apollo Humanoid -Roboter hinzufügen.
Google verbindet die Punkte mit zusätzlicher Programmierung, einem neuen erweiterten visuellen Sprachmodell namens Gemini Robotics-ER (verkörpertes Argument).
Gemini Robotics-er wird das räumliche Denken der Robotik verbessern und Roboterentwickler helfen, die Modelle mit vorhandenen Controllern zu verbinden.
Auch dies sollte sich im Fliege der Fliege verbessern und es den Robotern ermöglichen, schnell herauszufinden, wie sie unbekannte Objekte erfassen und verwenden können. Google ruft Gemini Rotbotics er als End-to-End-Lösung an und behauptet, dass “alle Schritte erforderlich sind, um einen Roboter direkt außerhalb der Box zu steuern, einschließlich Wahrnehmung, Zustandsschätzung, räumlichem Verständnis, Planung und Codegenerierung.”
Google stellt mehrere geschäfts- und forschungsorientierte Robotikunternehmen, einschließlich Boston Dynamics (Macher of Atlas), Agile Roboter und Agility -Roboter.
Alles in allem ist es ein potenzieller Segen für humanoide Robotikentwickler. Da die meisten dieser Roboter jedoch für Fabriken oder noch im Labor ausgelegt sind, kann es einige Zeit dauern, bis Sie einen Gemini-verstärkten Roboter in Ihrem Zuhause haben.
Sie könnten auch mögen
Source link