MidJourney ya era uno de los generadores de imágenes de IA más impresionantes que existen, y con el lanzamiento de la versión 5.1, ahora se ha vuelto mucho más poderoso. La actualización del algoritmo significa que, incluso para principiantes, ahora es increíblemente fácil crear impresionantes obras de arte con un esfuerzo mínimo, y deepfakes. Muchos y muchos deepfakes.

El generador de imágenes de IA entró en la conciencia pública el mes pasado después de que imágenes deepfake del Papa Francisco con un abrigo acolchado blanco se volvieran virales. La controversia provocó conversaciones sobre la ética de los generadores de IA como MidJourney, y la compañía tomó medidas poco después.

El uso de la palabra "papa" en MidJourney ahora está prohibido, pero crear deepfakes de otras personas, como el presidente Joe Biden, todavía está permitido— probablemente hasta que veamos una imagen viral de Biden usando un traje de neón rosa haciendo yoga en la Oficina Oval.

O tal vez una de Biden usando un traje de espartano intergaláctico que se parece un poco a Iron Man.

AD
Joe Biden como un espartano intergaláctico, creado con MidJourney.
Joe Biden como un espartano intergaláctico, creado con MidJourney.

MidJourney también permite a los usuarios crear deepfakes de alta calidad utilizando fotos como referencia. Esta función ha aumentado significativamente la popularidad de MidJourney debido a los impresionantes resultados que proporciona y su baja curva de aprendizaje. En este momento, es el modelo de imagen de IA más popular en términos de interés de los usuarios, superando a Dall-e y Stable Diffusion.

Búsquedas en Google para los generadores IA MidJourney (azul), Stable Diffusion (amarillo) y Dall-e (rojo). Imagen: Google Trends
Búsquedas en Google para MidJourney (azul), Stable Diffusion (amarillo) y Dall-e (rojo). Imagen: Google Trends

La última actualización de MidJourney promete mejoras en la forma en que el algoritmo interpreta las indicaciones de los usuarios. La versión 5.0 se lanzó hace solo tres meses y marcó una evolución significativa de la versión 4.

Este nuevo modelo ofrece una mayor coherencia, más precisión en las indicaciones de texto, menos bordes no deseados o artefactos de texto (las cosas extrañas y aleatorias que a veces aparecen en las imágenes) y resultados más nítidos en general, según MidJourney. La guinda del pastel es que la nueva versión fue entrenada para ser una IA más "opinativa".

AD

Ser opinativo significa que el modelo tiene la libertad de ser más creativo al interpretar la indicación del usuario. Esto resulta en mejores imágenes con indicaciones básicas, incluso con comandos absurdos de solo una o dos palabras.

Por ejemplo, simplemente comparar los resultados de las indicaciones "Billetera Bitcoin" utilizando la versión 5.1 y 5.0 demuestra las diferencias y mejoras. La versión 5.1 imagina una billetera de cuero, con un logotipo de Bitcoin bordado y colocado sobre una mesa de madera. La versión 5 simplemente muestra una billetera con un Bitcoin sobre una superficie plana.

La nueva versión enfatiza aún más las fortalezas que han llevado a la explosión de MidJourney, sin olvidar a los usuarios experimentados que ahora tienen un modo RAW si desean resultados más precisos y menos "opinados".

¿Y qué hay de las manos con muchos dedos? MidJourney v5.1 ha mejorado mucho. Las representaciones de manos ahora tienen éxito en la mayoría de los casos, aunque el generador todavía produce algunos errores.

El equipo de MidJourney dice que podríamos ver la versión 5.2 de su IA en el futuro, mejorando aún más las capacidades de esta herramienta. Si a la tercera va la vencida, entonces los días en que los generadores de IA arruinaban las manos en nuestros deepfakes favoritos podrían estar finalmente en los archivos del pasado.

Imagen creada por Decrypt usando IA (MidJourney V5.1)

Stay on top of crypto news, get daily updates in your inbox.