DALL·E 3 en Bing: no te vas a creer el salto de calidad
El 20 de septiembre OpenAI anunció que DALL·E 3, su siguiente versión del popular generador de imágenes con inteligencia artificial DALL·E 2, llegaría próximamente a ChatGPT.
Lo que no mencionó fue que el primer lugar en el que podríamos disfrutar de DALL·E 3 sería el generador de imágenes de Bing y ¡gratis!.
Actualmente parece que es la única forma de testear esta nueva y super mejorada versión de DALL·E, aunque en un comunicado OpenAI informó que a inicios de octubre ya estaría disponible en su popular chat.
Por ahora todos podemos acceder al creador de imágenes de Bing aquí, eso sí, armados de paciencia porque demora muchos minutos obtener resultados.
Yo ya estaba a punto de darme por vencida cuando mi recompensa llegó:
Un gato macarra que no tendría nada de relevante en un mundo post IA generativas, pero que en este caso concreto sí importa: el cartel en la mano, prueba de que ya no estamos trabajando con DALL·E 2; este es otro animal capaz de reflejar texto coherente en las imágenes.
Vaya salto de calidad
Desde el pasado fin de semana algunos usuarios en comunidades de Reddit comenzaron a notar una mejoría en la calidad de los resultados de Bing.
La herramienta, impulsada por DALL·E, es muy popular por ser gratuita, pero está lejos de ofrecer los mejores resultados.
DALL·E 2 ha sido el hijo menos brillante de OpenAI. Midjourney, Stable Diffusion y últimamente hasta Ideogram parecían llevarle ventaja. A partir de ahora no parece que será el caso.
Los primeros resultados que se han visto en Bing son espectaculares. La capacidad de generar texto fiel a la solicitud es el extra que necesitaba OpenAI para volver a poner el modelo en boca de todos.
A continuación, fíjate en la diferencia de calidad del resultado entre el anterior modelo y la reciente versión. En ambos usé el mismo promt.
Aquí DALL·E 2:
Y aquí DALL·E 3 :
Nada que ver.
El salto de calidad es de los grandes, de los que provocan lesión de cuello.
Para los detallistas: sí, sé que el texto no se reflejó con fidelidad en las 4 imágenes, solo en 2, pero oye, a mí me vale.
Habrá que seguir explorando, cuando Bing o ChatGPT provea, si con textos más largos o palabras menos comunes el resultado es consistente.
Actualización
Las pruebas siguientes muestran que en muchas ocasiones el texto en español es reflejado en inglés.
Ejemplo 1: aquí el cartel debió tener el texto «Únete a Baro»
Y aquí el texto «Accede a Baro»:
Y por último aquí debió poner «Únete»:
Ahorra en software
Únete al boletín premium semanal con los mejores lifetime deals y ofertas de software.
Prompt más naturales y ChatGPT haciéndolo todo
Con el anuncio de DALL·E 3 también llegó la sorpresa de que estaría disponible en ChatGPT para usuarios Plus.
Hasta ahora, además de en Bing y Designer de Microsoft, podíamos acceder a DALL·E mediante API y en Labs, la herramienta específica de OpenAI para generar imágenes con DALL·E.
Labs no parece ser ya la prioridad. El nuevo modelo estará antes disponible en ChatGPT y mediante API que en Labs.
En ChatGPT podremos crear prompts con el chat e ir introduciendo variaciones, según muestra el vídeo promocional publicado por OpenAI.
DALL·E 3🤝ChatGPT pic.twitter.com/90ITkUAln2
— OpenAI (@OpenAI) September 21, 2023
Mientras DALL·E 3 llega a ChatGPT, toma palomitas y únete a la cola de espera en Bing, valdrá la pena.