En Resumen

  • DALL-E 3, la actualización del generador de imágenes de IA de OpenAI, ya está disponible públicamente.
  • DALL-E 3 se considera una mejora significativa sobre su predecesor y ha generado entusiasmo en la comunidad de creadores de arte digital.
  • Aunque inicialmente se creía que el acceso sería para clientes de pago, se ha descubierto que los usuarios pueden acceder a DALL-E 3 a través de Bing Image Creator sin necesidad de trucos.

Diez días después de su anuncio, DALL-E 3 parece haber sido puesto a disposición del público a través de la herramienta Image Creator de Microsoft como parte de su suite de IA basada en el navegador.

El sábado por la mañana, las comunidades de creadores de arte digital en Reddit y Twitter descubrieron que estaban disponibles capacidades de interpretación de imágenes y texto significativamente mejoradas a través de Bing. Sin embargo, DALL-E 3, aún no está disponible en el sitio web de OpenAI.

DALL-E 3 es una actualización muy esperada del generador de imágenes de IA DALL-E 2 de OpenAI, que es inmensamente popular. Mientras que ChatGPT, el chatbot de IA generativa y herramienta de texto de OpenAI, disfruta de una posición dominante en su espacio, DALL-E enfrenta una dura competencia de herramientas como Midjourney y Stable Diffusion. Una comparación directa utilizando DALL-E 2 reveló algunas áreas en las que no cumplió con las expectativas.

En julio, los entusiastas del arte de IA pudieron experimentar con las mejoras en progreso de DALL-E 2 de OpenAI. El influencer de YouTube MattVidPro demostró que superaba a su predecesor y a otros generadores de imágenes.

"Esto supera todo lo que hemos visto antes, es increíble", dijo en ese momento. "Midjourney no puede competir a este nivel, ni siquiera creo que la versión seis de Midjourney pueda competir a este nivel".

Esta vista previa de la tecnología carecía de las protecciones implementadas por los principales desarrolladores de IA para evitar usos maliciosos o engañosos, lo que permitió a MatVidPro demostrar una implementación completamente sin censura de DALL-E.

Cuando DALL-E 3 fue anunciado oficialmente el 20 de septiembre, quedaron claras sus capacidades mejoradas, al mismo tiempo que se implementaron protecciones para el público. En ese momento, parecía que los clientes de pago de los productos ChatGPT Plus y Enterprise de OpenAI tendrían acceso primero.

El viernes por la noche, MattVidPro reveló que el lanzamiento público de DALL-E 3 era inminente, señalando que algunos usuarios podrían obtener acceso anticipado a través de Bing Image Creator al iniciar y cerrar sesión en sus cuentas de Microsoft, utilizando navegadores web poco populares o borrando la caché de su navegador. Sin embargo, al momento de escribir esto, tales trucos ya no son necesarios.

"Sabemos que DALL-E 3 es capaz de más en la interfaz de ChatGPT, pero parece que nadie está obteniendo acceso a eso todavía, pero definitivamente las personas están obteniendo acceso a través de Bing Image Creator", dijo.

Aunque la interfaz de Bing Image Creator no revela la versión de DALL-E que se está utilizando, MattVidPro compartió pruebas que revelarían si estabas utilizando la nueva versión. Entre ellas se encuentran la capacidad de representar texto legible en lugar de garabatos aleatorios y la capacidad de representar figuras históricas y famosas celebridades, aunque algunos señalaron que otras herramientas pueden estar limitando intencionalmente sus capacidades en este aspecto.

"Este modelo es tan poderoso que es difícil de cuantificar", dijo. "Dall-E 3 es absolutamente increíble, fácilmente es el mejor generador de imágenes de IA que existe".

"Sin lugar a dudas, cada generación que sale de esta cosa es mejor que cualquier otra cosa que haya visto de cualquier otro generador de imágenes antes", agregó.

José Antonio Lanz contribuyó a este informe.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.