La nueva IA de DeepMind controla tareas robóticas sin entrenamiento específico

The new AI from DeepMind controls robotic tasks without specific training.

Google DeepMind tiene un nuevo modelo de IA que puede dirigir tareas robóticas para las que no fue entrenado.

Llamado RT-2, el modelo aprende a partir de datos web y de robótica. Luego convierte esta información en instrucciones simples para las máquinas.

En las pruebas, se le pidió al modelo que realizara acciones que no se habían visto en los datos robóticos, como colocar naranjas en un recipiente correspondiente. Para seguir estas instrucciones, el sistema tuvo que traducir conocimientos de datos basados en la web. Según DeepMind, el modelo tuvo un éxito del 62% en estas operaciones, el doble que su predecesor, RT-1.

“Así como los modelos de lenguaje se entrenan en texto de la web para aprender ideas y conceptos generales, RT-2 transfiere conocimientos de datos web para informar el comportamiento del robot”, dijo Vincent Vanhoucke, jefe de robótica de DeepMind. “En otras palabras, RT-2 puede hablar robot”.

RT-2 fue probado en diversas habilidades robóticas que no estaban presentes en los datos robóticos. Crédito: Google DeepMind

Las pruebas mostraron que RT-2 tiene impresionantes capacidades de generalización. También tiene una comprensión semántica y visual mejorada de los datos robóticos que no se había encontrado previamente.

Es especialmente notable que el modelo pueda utilizar un razonamiento rudimentario para seguir comandos nuevos del usuario. Impresionantemente, incluso puede realizar razonamiento semántico de varias etapas. Por ejemplo, cuando se le indicó que eligiera un objeto que se pudiera usar como martillo, RT-2 identificó correctamente una roca como la mejor opción.

En una prueba, RT-2 descubrió que una roca sería el mejor objeto para levantar como un martillo improvisado. Crédito: Google DeepMind

En otra evaluación, se le ordenó al modelo empujar una botella de ketchup hacia un cubo azul.

Había varios objetos en la escena, pero el único en el conjunto de datos de entrenamiento era el cubo. Aun así, RT-2 empujó con éxito el ketchup hacia el destino especificado.

RT-2 tuvo un buen desempeño en tareas del mundo real. Crédito: Google DeepMind

DeepMind ha calificado a RT-2 como un avance en la inteligencia artificial. El laboratorio de Londres dice que el modelo nos acerca a un futuro de robots útiles.

“No solo RT-2 muestra cómo los avances en IA se están extendiendo rápidamente a la robótica, sino que también muestra una promesa enorme para robots de propósito más general”, dijo Vanhoucke. “Si bien aún queda mucho trabajo por hacer para permitir robots útiles en entornos centrados en los humanos, RT-2 nos muestra un futuro emocionante para la robótica que está al alcance de la mano”.

Puedes leer el artículo de estudio de RT-2 aquí.