No cuentes con la supercomputadora Dojo de Tesla para impulsar una revolución de la IA

Don't count on Tesla's Dojo supercomputer to drive an AI revolution.

Tendrías que ser bastante valiente para apostar en contra de la idea de que aplicar más potencia informática y datos al aprendizaje automático, una receta que dio lugar a ChatGPT, no conduzca a nuevos avances de algún tipo en la inteligencia artificial. Aun así, serías aún más valiente al apostar que esa combinación producirá avances o descubrimientos específicos en un plazo específico, por deseables que sean.

Un informe emitido el pasado fin de semana por el banco de inversión Morgan Stanley predice que una supercomputadora llamada Dojo, que Tesla está construyendo para mejorar su trabajo en la conducción autónoma, podría añadir 500 mil millones de dólares al valor de la empresa al proporcionar una gran ventaja en la fabricación de automóviles, los robotaxis y la venta de software a otras empresas.

El informe impulsó el precio de las acciones de Tesla, añadiendo más del 6 por ciento, o 70 mil millones de dólares, aproximadamente el valor de BMW y mucho menos de lo que Elon Musk pagó por Twitter, a la capitalización de mercado del fabricante de vehículos eléctricos a partir del 13 de septiembre.

El informe de 66 páginas de Morgan Stanley es una lectura interesante. Hace un argumento apasionado de por qué Dojo, los procesadores personalizados que Tesla ha desarrollado para ejecutar algoritmos de aprendizaje automático, y la enorme cantidad de datos de conducción que la empresa está recolectando de los vehículos Tesla en la carretera, podrían dar grandes dividendos en el futuro. Los analistas de Morgan Stanley aseguran que Dojo proporcionará avances que darán a Tesla una ventaja “asimétrica” sobre otros fabricantes de automóviles en la conducción autónoma y el desarrollo de productos. El informe incluso afirma que la supercomputadora ayudará a Tesla a expandirse a otras industrias donde la visión por computadora es fundamental, incluyendo la atención médica, la seguridad y la aviación.

Existen buenas razones para ser cautelosos acerca de esas grandiosas afirmaciones. Se puede entender por qué, en este momento particular de la manía de la inteligencia artificial, la estrategia de Tesla puede parecer tan cautivadora. Gracias a un notable avance en las capacidades de los algoritmos subyacentes, las asombrosas habilidades de ChatGPT se pueden rastrear hasta una simple ecuación: más cálculos x más datos = más inteligente.

Los magos de OpenAI fueron adeptos tempranos a este mantra de “más es mejor”, apostando sus reputaciones y los millones de sus inversores por la idea de que aumentar el tamaño de la infraestructura de ingeniería para las redes neuronales artificiales llevaría a grandes avances, incluyendo en modelos de lenguaje como los que alimentan a ChatGPT. En los años previos a la fundación de OpenAI, se había visto el mismo patrón en el reconocimiento de imágenes, con conjuntos de datos más grandes y computadoras más poderosas que llevaban a un notable salto en la capacidad de las computadoras para reconocer, aunque sea a un nivel superficial, lo que muestra una imagen.

La nueva biografía de Walter Isaacson sobre Musk, que ha sido ampliamente extractada durante la última semana, describe cómo la última versión del software de conducción autónoma de Tesla, optimistamente llamado Full Self Driving (FSD), que guía a sus vehículos por calles concurridas, se basa menos en reglas codificadas y más en una red neuronal entrenada para imitar una buena conducción humana. Esto es similar a cómo ChatGPT aprende a escribir al absorber ejemplos interminables de texto escrito por humanos. Musk ha dicho en entrevistas que espera que Tesla tenga un “momento ChatGPT” con FSD en el próximo año más o menos.

Musk ha hecho grandes promesas sobre avances en la conducción autónoma muchas veces antes, incluyendo una predicción de que habría un millón de robotaxis de Tesla para finales de 2020. Así que consideremos esto cuidadosamente.

Al desarrollar sus propios chips de aprendizaje automático y construir Dojo, Tesla ciertamente podría ahorrar dinero en el entrenamiento de los sistemas de IA detrás de FSD. Esto podría ayudarle a mejorar aún más sus algoritmos de conducción utilizando los datos de conducción del mundo real que recoge de sus autos, algo que sus competidores no tienen. Pero si esas mejoras cruzarán un punto de inflexión en la conducción autónoma o la visión por computadora en general parece virtualmente imposible de predecir.

Por un lado, FSD no se parece tanto a ChatGPT. Como explicaron los ingenieros de la compañía durante su evento AI Day del año pasado, la función está alimentada por múltiples programas y sistemas de aprendizaje automático diseñados para manejar una variedad de tareas en la carretera, como la dirección o la decodificación de marcas viales. Más datos y más cálculos pueden producir avances significativos en algunos de estos aspectos, pero un gran salto en la conducción autónoma requiere avances significativos en muchos o todos esos subsistemas. Las capacidades notablemente generales de ChatGPT, en cambio, fueron habilitadas al mejorar un sistema subyacente único: un algoritmo monolítico que despliega texto.

Otro problema: el video y otros datos de sensores son fundamentalmente diferentes al texto. La semana pasada, me reuní con robóticos que explicaron que una pregunta central para su campo es si el tipo de escalado que desbloqueó nuevas capacidades en ChatGPT podría transferirse al sentido robótico, la navegación y el razonamiento. Se puede construir una supercomputadora para trabajar en esos problemas. Pero aprender a partir de datos de video requiere mucha más potencia informática que procesar texto, y hacer avances fundamentales podría requerir exponencialmente más. Nadie, ni Tesla, ni Morgan Stanley, sabe con certeza cuántos datos o qué tan grande debe ser una supercomputadora para lograr avances fundamentales en la robótica.

Una tercera limitación en la tesis del dominio de Dojo de Morgan Stanley es la idea de que los avances en la conducción autónoma se transferirán a otros problemas. Aprender a conducir requiere una comprensión extensa del mundo físico, pero no le enseña a una máquina nada sobre cómo operar en el mundo más allá del entorno relativamente controlado de la carretera, con sus reglas y señales.

Le pregunté a Christian Gerdes, codirector del Centro de Investigación Automotriz en Stanford (CARS), qué opina sobre el enfoque de Tesla. Me respondió por correo electrónico desde un circuito de carreras en Portugal, donde está probando un sistema de conducción autónoma desarrollado en su laboratorio. Gerdes dice que en su campo existe una creencia creciente de que las capacidades de conducción autónoma escalarán con los datos y la potencia informática, pero aún no está claro hasta qué punto esto puede llegar. “Tenemos redes neuronales relativamente simples aprendiendo la física de las carreras”, dice Gerdes sobre sus propios experimentos. “Los resultados son bastante buenos, pero curiosamente, no siempre mejoran con más datos”.

Tal vez todo lo que necesitas es aún más datos y silicio. Según la estimación del informe de Morgan Stanley, pronto tendremos una idea de si este es el caso. Predice que la próxima versión de FSD se presentará en un Día de IA de Tesla a principios de 2024 y demostrará que Tesla ha logrado avances fundamentales en la conducción autónoma gracias a Dojo.

Tal vez. Pero dada la trayectoria de Tesla de prometer una utopía inminente de conducción autónoma, no apostaría ni invertiría en ello.