Google acaba de dar un paso significativo para revolucionar la IA aplicada a la robótica de la mano de dos nuevos modelos especializados basados en Gemini 2.0. Se trata de Gemini Robotics y Gemini Robotics-ER, tecnologías que DeepMind aspira a que se conviertan en el punto de partida de la próxima generación de "robots útiles".
De la mano de Gemini Robotics, Google pone el punto de mira en tres aspectos claves. En primer lugar, que la IA aplicada a los robots se pueda adaptar a las diferentes situaciones a las que son expuestos los dispositivos. Es por ello que sus nuevos modelos permiten completar todo tipo de tareas, incluso aquellas para las que no han sido entrenados.
Otro apartado crucial para la tecnología es que sea interactiva, para que los robots sean capaces de comprender instrucciones de forma rápida y adaptarse a cualquier cambio que se produzca, ya sea en sus labores o en el entorno en el que deben concretarlas.
Por último, Gemini Robotics se enfoca en la destreza, permitiendo que los robots completen acciones sin importar su complejidad. Esto es especialmente interesante al momento de lidiar con tareas que requieran de motricidad fina, ya que es de lo más difícil que tienen que abordar los desarrolladores de robots; sobre todo aquellos con características humanoides.
Gemini Robotics y Gemini Robotics-ER usan Gemini 2.0 como base, pero no son exactamente lo mismo. El primero es un modelo de visión-lenguaje-acción cuya principal meta es la implementación de acciones físicas para controlar a los robots. El segundo es un modelo de visión-lenguaje que se enfoca en la comprensión espacial y en optimizar capacidades como el reconocimiento de objetos tridimensionales, entre otras características.
Gemini Robotics, lo nuevo de Google aplicado a la robótica
Entre tantos elementos interesantes de Gemini Robotics-ER, destaca su habilidad de completar nuevas tareas sobre la marcha. El ejemplo más práctico que ha dado Google sobre esto indica que si el robot observa una taza de café, la inteligencia artificial puede intuir de forma inmediata cómo debe agarrarla y cuál es la trayectoria segura para acercarse a ella.
Si bien tecnologías como Gemini Robotics seguramente sean de especial utilidad para el desarrollo de robots humanoides, Google no se ha enfocado solamente en ellos. Los nuevos modelos de IA son compatibles con múltiples factores de forma, de modo que no funcionan únicamente con aparatos que tengan manos con dedos, sino también en aquellos que utilicen diferentes diseños de pinza.
Aun así, los de Mountain View han anunciado una alianza con Apptronik, los creadores del robot bípedo Apollo, para avanzar con la creación de nuevos modelos humanoides impulsados por Gemini 2.0. Dicha compañía fue noticia en 2024 tras aliarse con Mercedes-Benz para incorporar sus desarrollos robóticos en una de sus fábricas de Hungría.
En el apartado de seguridad, Google indica que Gemini Robotics-ER se ha puesto a disposición de varias empresas de robótica para que lo pongan a prueba. Entre ellas, Boston Dynamics.