La Llama de código abierto de Meta perturba la carrera de inteligencia artificial

Meta's open-source Llama disrupts the AI race.

En mayo, se filtró en línea un memo anónimo aparentemente escrito por un investigador de Google preocupado por el futuro de la compañía. Argumentaba que, mientras los ejecutivos discutían sobre la amenaza competitiva de la tecnología de generación de texto de OpenAI, el software de código abierto estaba “comiéndose nuestro almuerzo en silencio”.

Como prueba, el memo citaba a Llama, un gran modelo de lenguaje creado por Meta que inicialmente solo estaba disponible para investigadores por invitación, pero que en cuestión de días se filtró en 4Chan y rápidamente se hizo popular entre los programadores, quienes lo adaptaron y mejoraron. A las pocas semanas de su lanzamiento, variantes llamadas Alpaca y Vicuna eran casi tan buenas como ChatGPT pero lo suficientemente ágiles como para personalizar en una computadora portátil. “El impacto en la comunidad no se puede exagerar”, decía el memo filtrado de Google. “De repente, cualquiera puede experimentar”. La semana pasada, Meta lanzó la segunda versión de su modelo inesperadamente popular, Llama 2. Esta vez, es de código abierto y gratuito para uso comercial desde el principio. La nueva versión se hizo utilizando un 40 por ciento más de datos que la original, y un chatbot construido con el modelo es capaz de generar resultados al nivel de ChatGPT de OpenAI, según afirma Meta.

Al igual que ChatGPT, Bard de Google y otros modelos de IA generativos lanzados recientemente, es probable que Llama 2 haya costado millones de dólares crearlo. Pero solo el sistema de Meta está disponible de forma gratuita para desarrolladores, startups y otros interesados en crear variaciones personalizadas del modelo. Al ofrecer una opción más económica, Llama 2 de Meta facilita a las pequeñas empresas o a los programadores individuales crear nuevos productos y servicios, lo que potencialmente acelera el actual auge de la IA.

Meta no ofrece solo Llama 2. Cuenta con el apoyo de importantes socios que ya están poniendo el modelo a disposición de sus clientes, incluyendo a las startups de IA Hugging Face, Databricks y OctoML.

Microsoft, que ha invertido 10 mil millones de dólares en OpenAI, también ofrecerá descargas de Llama 2 a desarrolladores para su uso en la nube o en Windows. En una conferencia para clientes de Microsoft la semana pasada, el CEO Satya Nadella habló emocionado sobre la posibilidad de que los desarrolladores puedan utilizar la IA de código abierto de Meta junto con las ofertas propietarias de OpenAI. La división de nube de Amazon, AWS, también ofrece acceso a Llama 2.

Ahmad Al-Dahle, vicepresidente de Meta para IA generativa, se niega a decir qué papel jugó la filtración del primer modelo de Llama en la nueva estrategia de Meta para Llama 2.

“Si miras la historia de Meta, hemos sido grandes defensores del código abierto”, dice, señalando el ejemplo de PyTorch, una herramienta popular para desarrolladores que trabajan con aprendizaje automático. “Uno de los principales motivos para construir una comunidad en torno a esto fue que vimos que había demanda más allá de los investigadores para trabajar en estos modelos y mejorarlos”. Al-Dahle afirma que ya se está trabajando en el desarrollo de Llama 3, pero no especificó en qué se diferenciará.

Aunque Llama 2 le da credibilidad a Meta como líder en IA de código abierto, no todos los aspectos del lanzamiento pueden ser caracterizados como abiertos. Los datos de entrenamiento utilizados para crear el modelo se describen en los materiales de lanzamiento solo como “fuentes disponibles en línea públicamente”, y la compañía no ofrece más detalles sobre lo que se utilizó en la creación del modelo.

La licencia de Meta para Llama 2 también requiere que las compañías con más de 700 millones de usuarios activos mensuales establezcan un acuerdo de licencia separado con Meta. No está claro por qué, pero esta cláusula crea una barrera para que otros gigantes tecnológicos construyan sobre el sistema. El modelo también viene con una política de uso aceptable, que prohíbe generar código malicioso, promover la violencia o facilitar actividades delictivas, abuso o acoso. Meta no respondió a una pregunta sobre qué acciones podría tomar si se usa Llama 2 en violación de esa política.

Jon Turow, inversor de Madrona Ventures en Seattle, afirma que el cambio de Meta de intentar restringir la distribución del primer modelo de Llama a la liberación del segundo como código abierto podría permitir una nueva ola de creatividad utilizando grandes modelos de lenguaje. “Los desarrolladores y emprendedores son muy ingeniosos y van a descubrir lo que pueden obtener de Llama 2”, dice.

Turow compara la elección de Meta de lanzar Llama 2 este mes con la introducción por parte de Google del sistema operativo móvil Android en 2007 para competir con iOS de Apple. Al regalar una alternativa barata pero poderosa, Meta puede convertirse en un contrapeso a los sistemas propietarios como los desarrollados por OpenAI, estimulando la innovación que podría generar ideas que ayuden a mejorar los productos y servicios de Meta.

Nathan Lambert, investigador de IA en Hugging Face, una startup que lanza software de aprendizaje automático de código abierto, incluyendo modelos generativos, dice que Llama 2 es el primer modelo lanzado abiertamente al nivel de ChatGPT. No considera el proyecto como verdaderamente de código abierto debido a las limitadas revelaciones de Meta sobre su desarrollo, pero está asombrado por la cantidad de variaciones de Llama 2 que ve en su feed de redes sociales. Un ejemplo es la última versión de WizardLM, un sistema de IA similar a ChatGPT diseñado para seguir instrucciones complejas. Ocho de cada diez modelos populares actualmente en Hugging Face, muchos de los cuales están hechos para generar texto conversacional, son variaciones de Llama 2.

“Creo que se puede argumentar que Llama 2 es el evento más importante del año en IA”, dice Lambert. Él dice que los modelos propietarios tienen la ventaja hoy en día, pero cree que las versiones posteriores de Llama alcanzarán y, en poco tiempo, podrán realizar la mayoría de las tareas a las que las personas recurren a ChatGPT en la actualidad.

Lambert también dice que el lanzamiento de Llama 2 deja varias preguntas sin respuesta, en parte debido a la falta de documentación de los datos de entrenamiento. Y seguirá siendo el caso de que solo los actores principales como Meta, Google, Microsoft y OpenAI tendrán los recursos informáticos y el personal necesario para liderar los modelos de lenguaje grandes.

Pero tiene la esperanza de que, a pesar del éxito del enfoque propietario de OpenAI, los modelos de lenguaje estén entrando en una era de transparencia. Un acuerdo voluntario entre la Casa Blanca y siete grandes compañías de IA llama a realizar pruebas de cosas como el potencial de discriminación o el impacto en la sociedad o la seguridad nacional antes de la implementación.

Es una tendencia que podría ser desafiada por crecientes preguntas sobre la responsabilidad legal de los sistemas de IA y la creciente presión regulatoria de los políticos, que temen que los actores malintencionados comiencen a utilizar modelos de código abierto.

Al igual que Demis Hassabis, el investigador de IA que ahora lidera el desarrollo de IA de Google, Turow no está de acuerdo con la afirmación hecha por el memorando filtrado de Google de que esta y otras grandes compañías de IA están amenazadas por la IA de código abierto. Él piensa que los datos, el talento y el acceso a la potencia informática seguirán protegiendo a las mayores compañías tecnológicas, pero no las harán invencibles.

Ahora está observando lo que hacen las startups e investigadores con Llama 2, esperando ver cómo lo mejoran rápidamente, como sucedió con la primera iteración del modelo de Meta. Él dice que eso debería crear nuevas posibilidades tanto para las startups como para el campo más amplio de la IA. “Estamos viendo cómo el código abierto mejora continuamente, por lo que puede haber sorpresas que alteren a los líderes iniciales”, dice Turow. “No sé qué pasará”.