Géminis, la respuesta de Google a GPT-4, ¡está aquí!

¡Géminis, la nueva respuesta de Google a GPT-4, ya está aquí!

Google ha presentado Gemini, llamándolo su “modelo de IA más grande y capaz”.

El miércoles, Google DeepMind, el laboratorio de investigación en inteligencia artificial de la compañía, presentó el modelo altamente anticipado que supuestamente supera los principales puntos de referencia de OpenAI’s GPT-4 .

Desde que OpenAI lanzó ChatGPT hace un año, las principales compañías de tecnología han estado en una competencia por los avances en IA. Hasta ahora, Microsoft ha tenido una ligera ventaja debido a su acceso a los modelos de OpenAI como inversionista principal en la empresa de IA. Google ha estado atípicamente lento. El lanzamiento inicial de Bard, su competidor de ChatGPT, fue desastroso. Y en general, Google ha quedado rezagado en comparación con los lanzamientos de OpenAI y Microsoft con Bing y Copilot. Sin embargo, Google Gemini podría ser un avance lo suficientemente grande como para superar a OpenAI.

¿Qué es Gemini?

Lo que hace que Gemini sea tan bueno, según Google, es su capacidad multimodal, razonamiento sofisticado y habilidades de codificación avanzadas. A diferencia de otros modelos de IA multimodales que se construyen primero con texto, para luego agregar datos de imágenes, Gemini es multimodal de forma nativa. Esto significa que fue pre-entrenado en las modalidades de audio e imagen además del texto desde el principio. “Esto ayuda a Gemini a entender y razonar sin problemas sobre todo tipo de entradas desde cero, mucho mejor que los modelos multimodales existentes”, dijo el anuncio.

Gemini obtuvo un puntaje del 90 por ciento en comparación con el 86,4 por ciento de GPT-4 en MMLU (comprensión del lenguaje multitarea masiva), que prueba el conocimiento multi-disciplinario y la resolución de problemas.

Entonces sabemos que Gemini obtuvo buenas calificaciones, ¿pero cómo le va en el mundo real? Todos estamos a punto de descubrirlo. Google ha optimizado Gemini para tres tamaños diferentes: Gemini Ultra, el modelo más grande para tareas altamente complejas, Gemini Pro, el modelo de peso mediano capaz de la mayoría de las otras tareas, y Gemini Nano, un modelo eficiente lo suficientemente pequeño como para estar en tu teléfono.

Hablando de eso, a partir de hoy, Gemini Nano se ejecutará en el Google Pixel 8 Pro. Por ahora, Gemini Nano impulsará dos funciones en el dispositivo. Puede resumir transcripciones en la aplicación Recorder y también sugerirá respuestas para la función Smart Reply del teclado del teléfono (Gboard).

Incluso si no eres un usuario de Android, puedes probar Gemini en Google Bard a partir de hoy. Espera notar una mejora general en el razonamiento, la planificación y la comprensión. Gemini Pro impulsará Bard, pero solo las indicaciones de texto.

La multimodalidad llegará pronto. El próximo año, Google planea anunciar una versión avanzada de Bard que estará impulsada por Gemini Ultra.