El Futuro de la Robótica ¡Chatbots que Pueden Tomar Acción!

Covariant, una startup de robótica, está probando un chatbot estilo ChatGPT que puede operar un brazo robótico con el fin de desarrollar máquinas que sean más útiles en el mundo físico.

“`html

Título Ayudando a los Chatbots de IA a Obtener una Mano—y un Brazo

Los robots que pueden comunicarse e interactuar eficazmente con los humanos siempre han sido una visión tentadora para el futuro. Sin embargo, programar robots para realizar tareas complejas más allá de un conjunto limitado de quehaceres ha demostrado ser un desafío monumental. ¡Hasta ahora… 👾

Peter Chen, el CEO de Covariant, una renombrada empresa de software de robots, presentó recientemente un chatbot revolucionario que posee la capacidad de manipular objetos físicos. Imagina pedirle a un chatbot que te muestre el bolso que tiene frente a él, y que no solo describa los artículos, sino que también los recoja y los mueva con la ayuda de un brazo de robot. ¿Genial, verdad? 🤖

Este chatbot práctico es un paso innovador hacia darles a los robots el tipo de capacidades flexibles que solo hemos visto en programas como ChatGPT. Representa el prometedor futuro de los robots impulsados por IA que pueden hacer más que simplemente tareas mundanas. “Los modelos base son el futuro de la robótica”, declara Chen, refiriéndose a modelos de aprendizaje automático de propósito general a gran escala adaptados para dominios específicos. El impresionante chatbot de Covariant, alimentado por su Modelo de Base de Robot (RFM-1), no es una excepción.

RFM-1 ha sido entrenado no solo con vastas cantidades de texto, como sus contrapartes ChatGPT y Gemini de Google, sino también con datos de video y control de hardware obtenidos de decenas de millones de ejemplos de movimientos de robots en el mundo físico. Esta combinación permite a RFM-1 conectar el lenguaje con la acción de manera fluida. 😮

Este modelo va más allá de la competencia en el lenguaje. Puede generar videos que muestran robots completando una amplia gama de tareas. Por ejemplo, puede mostrarte cómo un robot debería agarrar un objeto de un contenedor desordenado. “Es un poco alucinante”, dice Chen. ¡Y tiene razón! 🤯

Pero eso no es todo. RFM-1 incluso ha demostrado la capacidad de controlar hardware en el que no ha sido entrenado específicamente. En el futuro, esto podría significar que un único modelo general podría operar un robot humanoide. Pieter Abbeel, cofundador y científico jefe de Covariant, cree que con un entrenamiento adicional, RFM-1 podría permitir que los robots realicen una variedad de tareas con fluidez, similar a cómo Tesla utiliza datos de sus autos para entrenar algoritmos de autoconducción. ¡Las posibilidades son infinitas! 🚀

Covariant, fundada en 2017, actualmente vende software que permite a los robots seleccionar artículos de contenedores en almacenes. Sin embargo, con modelos como RFM-1, pueden ampliar potencialmente las capacidades de sus robots para adaptarse a nuevas tareas de manera más fluida. Muchos roboticistas, incluyendo a Abbeel y sus colegas, ven los modelos de lenguaje detrás de ChatGPT y programas similares como un catalizador potencial para una revolución en la robótica 🤖.

Por supuesto, tales proyectos ambiciosos vienen con desafíos. Uno de los principales obstáculos es la falta de datos fácilmente disponibles para entrenar a los robots de la misma manera en que se pueden acceder fácilmente al texto y las imágenes en internet. Pulkit Agrawal, un profesor del MIT especializado en IA y robótica, hace hincapié en la necesidad de generar datos de entrenamiento para los robots. Esto puede implicar recolectar videos de humanos realizando tareas o crear simulaciones con robots. Google DeepMind, por ejemplo, ha desarrollado modelos de IA (RT-2) y conjuntos de datos (RT-X) para robots utilizando este enfoque.

Los impresionantes datos del brazo de robot de Covariant, adquiridos de sus implementaciones con clientes, son innegablemente útiles. Sin embargo, actualmente se limitan a tareas específicas de almacenes. Para lograr capacidades más generales en los robots, se debe recolectar una gama más amplia de datos. Cuántos datos se requieren y cómo recopilarlos de manera eficiente son preguntas abiertas con las que los investigadores están lidiando.

Un aspecto fascinante del trabajo de Covariant es su capacidad para mejorar la comprensión de los modelos de IA del mundo físico. Abbeel destaca que RFM-1, en comparación con el realista modelo de video de OpenAI, Sora, demuestra una mejor comprensión de las limitaciones y posibilidades del mundo real. Es un paso significativo hacia cerrar la brecha entre las simulaciones virtuales y las acciones físicas.

¿Quieres saber más sobre el futuro de la robótica y el increíble potencial de modelos como RFM-1? ¡Echa un vistazo a estos fascinantes artículos! 📚

  1. Los robots están montando la ola de entusiasmo por los humanoides con una valoración de $26 mil millones
  2. Usa la aplicación de IA de Google, Gemini, en tu teléfono Android
  3. Galaxy Z Fold 6 Ultra: Las verdaderas necesidades y 7 características
  4. Elon Musk dice que un modelo más económico de Tesla llegará para 2025
  5. El último modelo de OpenAI, Sora, puede generar videos que se ven decentes

“`<p>🛠️ Emocionantes posibilidades se presentan mientras continuamos explorando la integración de modelos de lenguaje y robótica. ¡Aceptemos el futuro y veamos a dónde nos lleva! Comparte tus pensamientos y predicciones con nosotros en los comentarios a continuación. Y recuerda difundir la palabra compartiendo este artículo en tus plataformas de redes sociales favoritas. ¡Juntos, podemos dar forma al futuro de la robótica! 🌟</p>