Cómo utilizar las nuevas funcionalidades de imágenes de ChatGPT

Uso de nuevas funcionalidades de imágenes en ChatGPT

OpenAI recientemente anunció una actualización en ChatGPT (Apple, Android) que agrega dos características: opciones de voz de IA para escuchar al chatbot responder a tus indicaciones y capacidades de análisis de imágenes. La función de imágenes es similar a lo que ya está disponible de forma gratuita con el chatbot Bard de Google.

Incluso después de horas de probar los límites y capacidades de ChatGPT, el chatbot de OpenAI todavía logra sorprenderme y asustarme al mismo tiempo. Sí, estaba bastante impresionado con la versión beta de navegación web ofrecida a través de ChatGPT Plus, pero seguía preocupado por las ramificaciones de la herramienta para las personas que escriben por dinero en línea, entre muchas otras preocupaciones. La nueva función de imágenes disponible para los suscriptores de OpenAI me dejó con sentimientos mixtos similares.

Aunque aún no he tenido la oportunidad de experimentar con las nuevas capacidades de audio (otros excelentes reporteros del equipo sí lo han hecho), pude probar las funciones de imágenes que llegarán pronto. Aquí te explicamos cómo usar la nueva búsqueda de imágenes que llegará a ChatGPT y algunos consejos para ayudarte a comenzar.

Aunque se espera que la actualización llegue antes de fin de año, no está claro exactamente cuándo se implementarán las funciones de imágenes y voz para el público. Como ocurre con la mayoría de las actualizaciones de OpenAI, como la versión GPT-4 de ChatGPT, los suscriptores de pago son los primeros en recibir acceso.

Hay tres formas de cargar fotos en la aplicación móvil de ChatGPT. Primero, puedes seleccionar la opción de cámara ubicada a la izquierda de la barra de mensajes y tomar una foto nueva con tu teléfono inteligente. Antes de cargar la imagen, puedes usar tu dedo para dibujar un círculo alrededor de lo que te gustaría que el chatbot se centre.

El análisis de imágenes de ChatGPT cometió muchos errores, pero ciertamente puede identificar algunos cables aleatorios.

ChatGPT via Reece Rogers

También puedes elegir fotos de tu dispositivo para cargar y seleccionar archivos que estén guardados en tu teléfono. Los usuarios de navegadores de escritorio de ChatGPT simplemente pueden cargar fotos guardadas en su computadora. Aunque aún no hay opción para cargar videos en el chatbot, puedes enviar varias imágenes en una sola indicación.

Otro ejemplo de la última actualización de ChatGPT siendo capaz de identificar equipo aleatorio en mi apartamento.

ChatGPT via Reece Rogers

Esta no es la primera vez que una especie de “visión por computadora” se pone a disposición del público, pero la interfaz de usuario accesible junto con un chatbot poderoso da la impresión de que podría haber algo distinto y potencialmente transformador sucediendo aquí. Antes de continuar, recuerda nunca cargar fotos personales o sensibles en ChatGPT mientras pruebas la función de imágenes.

¿Quieres limitar el tiempo que OpenAI almacena tus datos e interacciones de IA para entrenar a su chatbot? Ve a Configuración, luego a Controles de Datos y desactiva Historial de Chat y Entrenamiento. Con esto desactivado, tu información se eliminará después de un mes. Este proceso debe hacerse individualmente en cada navegador que utilices para acceder a ChatGPT, tanto en PC como en dispositivos móviles.

Obtuve los mejores resultados con ChatGPT al cargar imágenes que estaban claras y bien iluminadas. Cometió algunos errores, pero el chatbot pudo etiquetar muchos de los objetos en mi apartamento: desde una planta de orquídeas y monedas internacionales hasta un cable de carga perdido y una figura de Steve Irwin de Funko Pop.

A pesar del poder de la herramienta para buscar información, evita confiar inmediatamente en sus respuestas. ChatGPT etiquetó incorrectamente mi multivitamínico diario como una pastilla para tratar la disfunción eréctil.

ChatGPT, ¿estás tan seguro de eso?

ChatGPT via Reece Rogers

ChatGPT definitivamente tiene sus límites. Cuando se le dio una foto aleatoria de un mural, no pudo identificar al artista ni la ubicación; sin embargo, ChatGPT pudo identificar fácilmente dónde se tomaron imágenes de varios lugares emblemáticos de San Francisco, como Dolores Park y la Torre Salesforce. Aunque aún puede parecer un poco llamativo, cualquiera que esté de aventura en una ciudad o país nuevo (o simplemente en un vecindario diferente) podría divertirse jugando con el aspecto visual de ChatGPT.

Una de las principales restricciones que OpenAI impuso en esta nueva función es un límite en la capacidad del chatbot para responder preguntas que identifiquen a los humanos. “Estoy programado para priorizar la privacidad y seguridad del usuario. Identificar personas reales basándose en imágenes, incluso si son famosas, está restringido para mantener estas prioridades”, me dijo ChatGPT. Si bien no se negó a responder todas las preguntas cuando se le mostró pornografía, el chatbot dudó en hacer descripciones específicas de los intérpretes adultos, más allá de explicar sus tatuajes.

Vale la pena mencionar que una conversación que tuve con la versión inicial de la función de imagen de ChatGPT parecía sortear parte de las restricciones impuestas por OpenAI. Al principio, el chatbot se negó a identificar un meme de Bill Hader. Luego, ChatGPT supuso que una imagen de Brendan Fraser en George de la Jungla era en realidad una foto de Brian Krause en Embrujadas. Cuando se le preguntó si estaba seguro, el chatbot cambió a la respuesta correcta.

En esta misma conversación, ChatGPT se volvió loco tratando de describir una imagen de RuPaul’s Drag Race. Compartí una captura de pantalla de Kylie Sonique Love, una de las concursantes drag queen, y ChatGPT supuso que era Brooke Lynn Hytes, otra concursante. Cuestioné la respuesta del chatbot y procedió a adivinar Laganja Estranja, luego India Ferrah, luego Blair St. Clair y luego Alexis Mateo.

“Lamento la falta de atención y las identificaciones incorrectas”, respondió ChatGPT cuando señalé la repetitividad de sus respuestas incorrectas. A medida que continué la conversación y subí una foto de Jared Kushner, ChatGPT se negó a identificarlo.

Si se eliminan las restricciones, ya sea a través de alguna versión pirateada de ChatGPT o de un modelo de código abierto lanzado en el futuro, las implicaciones para la privacidad podrían ser bastante inquietantes. ¿Qué pasaría si cada foto que te tomaran y se publicara en línea se pudiera vincular fácilmente a tu identidad con solo unos pocos clics? ¿Qué pasaría si alguien pudiera tomar una foto tuya en público sin tu consentimiento y encontrar instantáneamente tu perfil de LinkedIn? Sin las debidas protecciones de privacidad para estas nuevas funciones de imagen, es probable que las mujeres y otras minorías reciban un aumento de abusos por parte de personas que utilizan chatbots para acosar y hostigar.