El Santo Grial de Qualcomm la IA generativa llegará pronto a los teléfonos

Qualcomm's Holy Grail, generative AI, coming soon to phones

La inteligencia artificial generativa, como ChatGPT y Midjourney, ha deslumbrado la imaginación y ha perturbado industrias, pero su debut ha estado principalmente limitado a las ventanas del navegador en computadoras de escritorio. El próximo año, podrás aprovechar la inteligencia artificial generativa sobre la marcha una vez que los teléfonos premium se lancen con los chips de última generación de Qualcomm en su interior.

Los teléfonos han utilizado la inteligencia artificial durante años para retocar fotos y mejorar la autocorrección, pero las herramientas de inteligencia artificial generativa podrían llevar el siguiente nivel de mejoras a la experiencia móvil. Qualcomm está incorporando inteligencia artificial generativa en su próxima generación de chips premium, que se estrenarán en su Cumbre anual de Qualcomm en Hawái a finales de octubre.

Los asistentes a la Cumbre podrán experimentar de primera mano lo que la inteligencia artificial generativa aportará a los teléfonos, pero Ziad Asghar, vicepresidente senior de gestión de productos de Qualcomm, describió a ENBLE por qué los usuarios deberían emocionarse por la inteligencia artificial en el dispositivo. En primer lugar, tener acceso a los datos de un usuario, como patrones de conducción, búsquedas de restaurantes, fotos y más, todo en un solo lugar, hará que las soluciones generadas por la inteligencia artificial en tu teléfono sean mucho más personalizadas y útiles que las respuestas generales de la inteligencia artificial generativa basada en la nube.

“Creo que eso va a ser el Santo Grial”, dijo Asghar. “Esa es la verdadera promesa que nos entusiasma mucho sobre hacia dónde puede ir esta tecnología”.

Hay otras ventajas de tener inteligencia artificial generativa en el dispositivo. Lo más importante es que las consultas y los datos personales buscados se mantienen privados y no se transmiten a través de un servidor remoto. El uso de la inteligencia artificial local también es más rápido que esperar la computación en la nube, y puede funcionar mientras se viaja en aviones u otras áreas sin servicio celular.

Pero una solución en el dispositivo también tiene sentido en términos de negocios y eficiencia. A medida que los modelos de aprendizaje automático se han vuelto más complejos (de cientos de miles de parámetros a miles de millones, según Asghar), es más caro ejecutar servidores que respondan consultas, como explicó Qualcomm en un documento técnico publicado el mes pasado. En abril, se estimaba que OpenAI gastaba alrededor de $700,000 al día para que ChatGPT respondiera a las solicitudes, y esa predicción de costos se basaba en el modelo GPT-3 anterior, que es menos complejo y probablemente más costoso de mantener a gran escala. En lugar de necesitar una granja de servidores completa, la solución de Qualcomm es hacer que el cerebro de silicio existente del dispositivo haga todo el pensamiento necesario, sin costo adicional.

“Ejecutar inteligencia artificial en tu teléfono es efectivamente gratuito: pagaste por la potencia informática por adelantado”, dijo el analista de Techsponential, Avi Greengart, a ENBLE por correo electrónico.

Greengart vio la inteligencia artificial generativa en el dispositivo de Qualcomm en acción cuando el fabricante de chips la mostró en el Mobile World Congress en febrero, utilizando un teléfono Android con Snapdragon 8 Gen 2 para ejecutar el software generador de imágenes Stable Diffusion. A pesar de ser una demostración temprana, lo encontró “tremendamente emocionante”.

Un chipset Snapdragon 8 Gen 2.

David Lumb/CNET

Lo que la inteligencia artificial generativa en el dispositivo ofrece a los usuarios

Qualcomm tiene ideas sobre lo que las personas podrían hacer con la inteligencia artificial generativa en los teléfonos, mejorando desde tareas de productividad hasta ver entretenimiento y crear contenido.

Como mostró la demostración de Stable Diffusion, la inteligencia artificial generativa en el dispositivo podría permitir a las personas ajustar imágenes a voluntad, como pedirle que cambie el fondo para ponerlo frente a los canales de Venecia, según Asghar. O podrían hacer que genere una imagen completamente nueva, pero eso es solo el comienzo, ya que los modelos de aprendizaje grandes de texto y visuales podrían trabajar en sucesión para fluir desde una idea hasta una salida lista.

Usando múltiples modelos, dijo Asghar, un usuario podría tener su discurso traducido por el reconocimiento automático de voz en texto que luego se alimenta a un generador de imágenes. Lleva eso un paso más allá y haz que tu teléfono represente el rostro de una persona, que utiliza inteligencia artificial generativa para hacer movimientos realistas de la boca y texto a voz para hablar de vuelta, y ¡boom!, tienes un asistente virtual impulsado por inteligencia artificial generativa con el que puedes tener conversaciones completas.

Este ejemplo específico podría estar impulsado en parte por inteligencia artificial de terceros, como el modelo de lenguaje grande Llama 2 de la empresa matriz de Facebook, Meta, en asociación con Microsoft, así como Qualcomm.

“[Llama 2] permitirá a los clientes, socios y desarrolladores crear casos de uso, como asistentes virtuales inteligentes, aplicaciones de productividad, herramientas de creación de contenido, entretenimiento y más”, dijo Qualcomm en un comunicado de prensa en ese momento. “Estas nuevas experiencias de inteligencia artificial en el dispositivo, impulsadas por Snapdragon, pueden funcionar en áreas sin conectividad o incluso en modo avión”.

Dentro del museo solo con cita previa de la sede de Qualcomm lleno de teléfonos retro

Qualcomm no limitará estas características a los teléfonos. En su próxima cumbre, la compañía planea anunciar soluciones de IA generativa para PC y automóviles también. Ese asistente personal podría ayudarte con tus listas de tareas, programar reuniones y enviar correos electrónicos. Si estás atrapado fuera de la oficina y necesitas hacer una presentación, Asghar dijo que la IA podría generar un nuevo fondo para que no parezca que estás sentado en tu coche y mostrar una presentación de diapositivas (o incluso ayudar a presentarla).

“Para aquellos de nosotros que crecimos viendo El Auto Increíble, bueno, KITT ahora será real”, dijo Asghar, refiriéndose al icónico auto inteligente de la serie de televisión.

Independientemente de la plataforma, la solución central de IA generativa existirá en el dispositivo. Podría ayudar con tareas de oficina, como generar automáticamente notas de una llamada y crear una presentación de cinco diapositivas que resuma sus puntos clave (“Esto es como Clippy, pero en esteroides, ¿verdad?” dijo Asghar). O podría fabricar mundos digitales desde cero en AR y VR.

Más allá de los mundos de fantasía, la IA generativa podría ayudar a las personas ciegas a navegar por el mundo real. Asghar describió una situación en la que los modelos de imagen a imagen en 3D a texto a voz podrían usar la cámara del teléfono para reconocer cuando un usuario está en una intersección e informarles cuándo detenerse, así como cuántos coches vienen en qué direcciones.

En el ámbito educativo, tal vez utilizando una webcam o la cámara de un teléfono, la IA generativa podría evaluar qué tan bien los estudiantes están absorbiendo una lección de enseñanza, tal vez rastreando sus expresiones y lenguaje corporal. Y luego la IA generativa podría adaptar el material a las fortalezas y debilidades de cada estudiante, teorizó Asghar.

Estas son todas las predicciones de Qualcomm, pero las partes interesadas tendrán que decidir cómo aprovechar mejor la tecnología para mejorar sus propios productos y servicios. Para los teléfonos, la IA generativa podría tener un impacto real una vez que se integre con aplicaciones móviles para experiencias de juego más personalizadas, redes sociales y creación de contenido, dijo Greengart de Techsponential.

Es difícil decir qué significa eso para los usuarios hasta que los desarrolladores de aplicaciones tengan la tecnología de IA generativa a mano para experimentar e integrar en sus aplicaciones. Es más fácil extrapolar lo que podría hacer basándose en cómo la IA ayuda a las personas en este momento. Roger Entner, analista de Recon Analytics, predice que la IA generativa ayudará a corregir fallas en fotos subóptimas, generará filtros para redes sociales y perfeccionará la autocorrección, problemas que existen en la actualidad.

“La IA generativa aquí crea una mejora en la calidad de uso que pronto daremos por sentada”, dijo Entner a ENBLE por correo electrónico.

Un Snapdragon 8 Gen 2 en un disco rojo frente a un equipo utilizado para probar chips en producción.

David Lumb / ENBLE

La IA generativa llegará primero a los teléfonos de gama alta

Las soluciones actuales de IA generativa dependen de grandes granjas de servidores para responder a consultas a gran escala, pero Qualcomm está seguro de que su silicio en el dispositivo puede manejar las necesidades de un solo usuario. En los laboratorios de Asghar, los chips de la compañía manejaron modelos de IA con 7 mil millones de parámetros (aspectos que evalúan los datos y cambian el tono o la precisión de su resultado), lo que está muy por debajo de los 175 mil millones de parámetros del modelo GPT-3 de OpenAI que alimenta a ChatGPT, pero se adaptará a las búsquedas móviles.

“Realmente podremos demostrar que se ejecuta en el dispositivo en la cumbre de [Hawai]”, dijo Asghar.

El dispositivo de demostración probablemente incluirá el próximo chip de gama alta de Qualcomm, presumiblemente el Snapdragon 8 Gen 3 que se utilizará en los teléfonos Android premium del próximo año. El dispositivo de demostración que ejecuta Stable Diffusion en el MWC 2023 utilizó el Snapdragon 8 Gen 2 anunciado en la Cumbre Snapdragon del año pasado en Hawái.

En una era en la que los teléfonos apenas duran todo el día antes de necesitar recargarse, también existe la preocupación de si invocar al genio de la IA generativa durante todo el día agotará aún más la batería. Tendremos que esperar pruebas en el mundo real para ver cómo los teléfonos implementan y optimizan la tecnología, pero Asghar señaló que la demostración del MWC 2023 estuvo ejecutando consultas para los asistentes durante todo el día y no agotó la batería ni se calentó. Él cree que el silicio de Qualcomm es capaz de manera única, con la IA generativa funcionando principalmente en el procesador Hexagon y la unidad de procesamiento neuronal de un chip Snapdragon, con un “muy buen consumo de energía”.

“Creo que habrá preocupación para aquellos que no tienen piezas de hardware dedicadas para hacer este procesamiento”, dijo Asghar.

Asghar cree que los teléfonos Android premium del próximo año, alimentados con los chips de Qualcomm, podrán utilizar la inteligencia artificial generativa. Pero llevará algún tiempo que esta tecnología se extienda a los teléfonos más baratos. Al igual que en los teléfonos actuales, la asistencia de IA para mejorar imágenes, audio y video es mejor en los modelos de gama alta y menos efectiva en los modelos más baratos, las capacidades de la IA generativa serán menores (pero aún presentes) a medida que desciendas en el catálogo de chips de Qualcomm.

“Tal vez puedas hacer un modelo de más de 10 mil millones de parámetros en los modelos premium, y en el nivel inferior podría ser menor a eso, y si estás por debajo de eso, podría ser aún menor”, dijo Asghar. “Por lo tanto, será una degradación gradual de esas experiencias, pero también se extenderán a otros productos”.

Al igual que con el 5G, Qualcomm puede ser el primero en adoptar la inteligencia artificial generativa, pero no será el último. Apple ha estado mejorando silenciosamente su IA en dispositivos, con el vicepresidente senior de software Craig Federighi mencionando en una conversación posterior a la Conferencia Mundial de Desarrolladores que han incorporado un modelo de lenguaje de transformador más poderoso para mejorar la corrección automática. Incluso se rumorea que Apple ha estado probando su propio chatbot llamado “Apple GPT” internamente. Se dice que la gigante tecnológica está desarrollando su propio marco de trabajo para crear grandes modelos de lenguaje con el fin de competir en el espacio de la IA, que se ha calentado desde que OpenAI lanzó ChatGPT al público a fines de 2022.

Mira esto:

La IA de Apple podría competir contra la IA Bard de Google y la IA Bing de Microsoft, ambas han tenido lanzamientos limitados este año para pruebas públicas. Estos siguen el modelo más tradicional de “chatbot inteligente” para mejorar el software a través de la IA generativa, pero es posible que lleguen a los teléfonos a través de aplicaciones o se acceda a ellos mediante un navegador web. Tanto Google como Microsoft ya están integrando la IA generativa en sus plataformas de productividad, por lo que es probable que los usuarios vean sus esfuerzos primero en las versiones móviles de Google Docs o Microsoft Office.

Pero para la mayoría de los propietarios de teléfonos, la IA generativa basada en chips de Qualcomm podría ser el primer uso impactante de una nueva tecnología. Tendremos que esperar la Cumbre Snapdragon para ver cuánto podría estar cambiando nuestra experiencia móvil tan pronto como el próximo año.