En Resumen

  • OpenAI ha estado probando en privado una nueva iteración de su modelo de IA generativa de imágenes, que supera las versiones anteriores.
  • Las muestras filtradas muestran imágenes nítidas y realistas con iluminación, reflejos y detalles precisos, muy diferentes a lo permitido hasta ahora en otras versiones.
  • El acceso al nuevo generador de imágenes es extremadamente limitado, y posiblemente estará censurado antes de su lanzamiento público.

OpenAI ha estado probando en privado una nueva iteración de su modelo de inteligencia artificial generativa (IA) de imágenes durante los últimos meses, y muestras tempranas filtradas por el YouTuber MattVidPro muestran que supera a los generadores de imágenes anteriores.

"Es extremadamente emocionante, esto supera cualquier cosa que hayamos visto antes, es increíble", dijo Matt en un avance que publicó en YouTube. "Midjourney no puede competir a este nivel, ni siquiera creo que la versión 6 de Midjourney pueda competir a este nivel".

Sin embargo, no esperes poder probarlo pronto. El acceso es extremadamente limitado.

Es probable que el modelo no publicado sea una mejora de DALL-E 2 y se esté probando a través de una vista previa solo por invitación dentro de ChatGPT-4. Matt dijo que solo alrededor de 400 personas en todo el mundo tienen acceso a este nuevo generador de imágenes de OpenAI.

Las muestras de imágenes demuestran las habilidades avanzadas de la IA, aunque bien limitadas. Produjo imágenes nítidas con iluminación y reflejos que imitan fotos reales. El modelo recreó pinturas detalladas hasta los trazos de pincel visibles. También recreó marcas como "Snickers" y logotipos de marcas conocidas como Subway de manera impecable en los productos generados, y logró una buena ortografía en el texto renderizado.

Un ejemplo de una imagen producida por el texto a imagen de OpenAI. Fuente: MattVidPro
Un ejemplo de una imagen producida por el texto a imagen de OpenAI. Fuente: MattVidPro

Mientras que los generadores de imágenes actuales tienen dificultades con manos coherentes, los ejemplos mostraron manos realistas y correctamente proporcionadas. Los fondos también parecían más convincentes que los sistemas de IA competidores.

OpenAI aparentemente eliminó sus filtros de seguridad para probar el potencial completo del modelo. Los usuarios dijeron que puede generar contenido violento y desnudez sin vacilación. Sin embargo, sabiendo la postura de OpenAI hacia el contenido NSFW, es poco probable que se lance una versión pública oficial bajo esos estándares.

"Es OpenAI, así que puedes apostar a que lo van a censurar como hacen con todo antes de lanzarlo", observó Matt.

Algunos expertos han criticado a OpenAI por "simplificar" sus modelos para evitar controversias potenciales. Algunos estudios incluso sugieren que OpenAI entrenó a ChatGPT para tener un fuerte sesgo político en sus resultados.

Sin embargo, la calidad constante mostrada en las muestras es un gran avance. Destaca los esfuerzos continuos de OpenAI para mejorar las capacidades de la inteligencia artificial generativa. La compañía podría revelar más sobre su progreso más adelante este año, especialmente si el campo del reconocimiento y generación de imágenes ayuda a mejorar la robustez de su producto estrella: un GPT-4 multimodal capaz de comprender texto, imágenes y borradores en una sola indicación.

Por ahora, la tecnología sigue limitada a pruebas cerradas con un número minúsculo de usuarios.

A medida que los modelos continúan mejorando, la línea entre lo artificial y lo real se difumina aún más. Si bien esto emociona a muchos, las preocupaciones sobre el mal uso persistirán. Construir esta tecnología de manera responsable sigue siendo un desafío urgente.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.