OpenAI refuerza su herramienta de IA generadora de imágenes con DALL-E 3

OpenAI refuerza DALL-E 3, su herramienta de IA generadora de imágenes

OpenAI ha presentado la próxima generación de su herramienta de creación de imágenes. Conocida como DALL-E 3, la nueva versión está diseñada para entender mejor las descripciones de texto y crear imágenes más precisas y fieles. En su nueva página web de DALL-E 3, OpenAI no reveló mucho sobre la herramienta, pero dio pistas sobre cómo pretende superar a su predecesor DALL-E 2.

DALL-E 3 está diseñado para comprender mejor los matices y detalles de tus descripciones, creando así imágenes más precisas, dijo OpenAI. Los generadores de imágenes basados en inteligencia artificial actuales a veces ignoran palabras en tus descripciones, lo que resulta en imágenes que no cumplen con lo que se desea. Según las imágenes mostradas en la página de DALL-E 3, la nueva versión parece capaz de crear imágenes más precisas, detalladas e imaginativas.

También: Los mejores generadores de imágenes de IA de 2023

Con el auge de la IA, los generadores de imágenes se han vuelto populares entre individuos y empresas. Herramientas como DALL-E 2, Bing Image Creator de Microsoft, Midjourney, Stable Diffusion, DreamStudio y Craiyon funcionan más o menos de la misma manera. Usando una descripción, describes la imagen que deseas generar. Luego eliges un estilo y otros atributos. Como respuesta, la herramienta crea una o más imágenes que, con suerte, coinciden con tu solicitud.

Pero al igual que muchos de los bots de IA actuales, estos generadores de imágenes pueden ser difíciles de usar. Por lo general, debes redactar tu descripción de la manera correcta. Y aún así, no siempre interpretan tus solicitudes correctamente. Reconociendo que los sistemas modernos de texto a imagen te obligan a aprender ingeniería de descripciones, OpenAI dijo que DALL-E 3 sería un gran avance en la generación de imágenes que se ajustan mejor a tus descripciones.

Construido sobre ChatGPT, DALL-E 3 estará accesible a través de la plataforma ChatGPT. La ventaja aquí es que podrás usar ChatGPT para desarrollar tus ideas y descripciones de imágenes. Luego podrás hacer una solicitud para crear una imagen utilizando una frase sencilla o un párrafo más detallado.

También: Mis dos complementos favoritos de ChatGPT Plus y las cosas notables que puedo hacer con ellos

En los ejemplos ofrecidos en la página de DALL-E 3, OpenAI mostró cómo funcionaría la nueva versión.

Se generó una imagen basada en la descripción: “Pequeños reyes de las papas vistiendo majestuosas coronas, sentados en tronos, supervisando su vasto reino de papas lleno de súbditos y castillos de papas”.

Se creó una segunda imagen a partir de la descripción: “Una ilustración de un aguacate sentado en la silla de un terapeuta, diciendo ‘Me siento tan vacío por dentro’, con un agujero del tamaño de la semilla en su centro. El terapeuta, una cuchara, toma notas.”

Y se generaron dos imágenes basadas en una descripción que decía: “Una pintura al óleo expresiva de un jugador de baloncesto realizando un mate, representado como una explosión de una nebulosa”. Una imagen utilizó DALL-E 2, mientras que la otra utilizó DALL-E 3.

OpenAI también destacó que ha limitado la capacidad de DALL-E 3 para crear contenido violento, para adultos o odioso, como lo ha hecho con las versiones anteriores. Se han realizado mejoras de seguridad en áreas como la creación de figuras públicas y ciertos sesgos perjudiciales. Por ejemplo, la herramienta rechazará solicitudes que pidan una figura pública por nombre.

También: ¿Quién es dueño del código, las imágenes y las narrativas generadas por IA?

Las imágenes generadas por IA también pueden ser un problema cuando se utilizan para representar a una persona o evento real, engañando a las personas haciéndoles creer que la imagen es real. Para combatir ese problema, OpenAI dijo que está probando una nueva herramienta interna que puede determinar si una imagen fue creada por DALL-E 3 o no.

Actualmente en pruebas cerradas, se espera que DALL-E 3 se lance para los clientes de ChatGPT Plus y Enterprise a principios de octubre.