MidJourney ya era uno de los generadores de imágenes de IA más impresionantes que existen, y con el lanzamiento de la versión 5.1, ahora se ha vuelto mucho más poderoso. La actualización del algoritmo significa que, incluso para principiantes, ahora es increíblemente fácil crear impresionantes obras de arte con un esfuerzo mínimo, y deepfakes. Muchos y muchos deepfakes.
El generador de imágenes de IA entró en la conciencia pública el mes pasado después de que imágenes deepfake del Papa Francisco con un abrigo acolchado blanco se volvieran virales. La controversia provocó conversaciones sobre la ética de los generadores de IA como MidJourney, y la compañía tomó medidas poco después.
El uso de la palabra "papa" en MidJourney ahora está prohibido, pero crear deepfakes de otras personas, como el presidente Joe Biden, todavía está permitido— probablemente hasta que veamos una imagen viral de Biden usando un traje de neón rosa haciendo yoga en la Oficina Oval.
O tal vez una de Biden usando un traje de espartano intergaláctico que se parece un poco a Iron Man.
Joe Biden como un espartano intergaláctico, creado con MidJourney.
MidJourney también permite a los usuarios crear deepfakes de alta calidad utilizando fotos como referencia. Esta función ha aumentado significativamente la popularidad de MidJourney debido a los impresionantes resultados que proporciona y su baja curva de aprendizaje. En este momento, es el modelo de imagen de IA más popular en términos de interés de los usuarios, superando a Dall-e y Stable Diffusion.
Búsquedas en Google para MidJourney (azul), Stable Diffusion (amarillo) y Dall-e (rojo). Imagen: Google Trends
La última actualización de MidJourney promete mejoras en la forma en que el algoritmo interpreta las indicaciones de los usuarios. La versión 5.0 se lanzó hace solo tres meses y marcó una evolución significativa de la versión 4.
V5.1 is now available! Images are more coherent, sharp, and beautiful. It's easier to use and should respond more precisely to instructions. We've also added a "RAW" mode for expert users to reduce the 'opinionatedness' of our model and give you more creative control.
Este nuevo modelo ofrece una mayor coherencia, más precisión en las indicaciones de texto, menos bordes no deseados o artefactos de texto (las cosas extrañas y aleatorias que a veces aparecen en las imágenes) y resultados más nítidos en general, según MidJourney. La guinda del pastel es que la nueva versión fue entrenada para ser una IA más "opinativa".
Ser opinativo significa que el modelo tiene la libertad de ser más creativo al interpretar la indicación del usuario. Esto resulta en mejores imágenes con indicaciones básicas, incluso con comandos absurdos de solo una o dos palabras.
Por ejemplo, simplemente comparar los resultados de las indicaciones "Billetera Bitcoin" utilizando la versión 5.1 y 5.0 demuestra las diferencias y mejoras. La versión 5.1 imagina una billetera de cuero, con un logotipo de Bitcoin bordado y colocado sobre una mesa de madera. La versión 5 simplemente muestra una billetera con un Bitcoin sobre una superficie plana.
La nueva versión enfatiza aún más las fortalezas que han llevado a la explosión de MidJourney, sin olvidar a los usuarios experimentados que ahora tienen un modo RAW si desean resultados más precisos y menos "opinados".
¿Y qué hay de las manos con muchos dedos? MidJourney v5.1 ha mejorado mucho. Las representaciones de manos ahora tienen éxito en la mayoría de los casos, aunque el generador todavía produce algunos errores.
El equipo de MidJourney dice que podríamos ver la versión 5.2 de su IA en el futuro, mejorando aún más las capacidades de esta herramienta. Si a la tercera va la vencida, entonces los días en que los generadores de IA arruinaban las manos en nuestros deepfakes favoritos podrían estar finalmente en los archivos del pasado.
Imagen creada por Decrypt usando IA (MidJourney V5.1)
Daily Debrief Newsletter
Start every day with the top news stories right now, plus original features, a podcast, videos and more.
Artificial Intelligence
The latest artificial intelligence news, in-depth features, explainers, and analysis, spanning from generative to transformational technology and beyond.
La versión alfa de Midjourney v7, que se lanzó la semana pasada, llega en un momento en que el generador de imágenes una vez dominante está claramente perdiendo terreno. Aunque todavía cuenta con una enorme base de usuarios impulsada por Discord de unos 20 millones de personas, herramientas más nuevas como GPT-4o de OpenAI, Reve e Ideogram 3.0 lo han superado en realismo, precisión y funcionalidad.
El nuevo modelo marca la primera actualización importante de Midjourney en casi un año, introducie...
Mientras innumerables empresas compiten por quedarse con tus dólares por una suscripción de IA, una plataforma ha acaparado silenciosamente casi todos los principales modelos de imagen y video de IA disponibles hoy.
Freepik —sí, ese sitio de imágenes de stock que probablemente hayas usado antes— se ha transformado en una navaja suiza creativa que podría ahorrarte cientos de dólares en tarifas.
A pesar de su nombre, Freepik no es gratuito. Pero su propuesta de suscripción es razonable: ¿Por qué p...
Este 05 de abril marca lo que los entusiastas de las criptomonedas celebran como el 50º cumpleaños de Satoshi Nakamoto, según la fecha de nacimiento que el misterioso creador de Bitcoin registró en su perfil de la P2P Foundation—una organización sin fines de lucro dedicada a investigar y promover la adopción de soluciones P2P.
Según su perfil, Satoshi nació el 5 de abril de 1975. Por supuesto, es tan no verificado como la mayoría de las leyendas que rodean la saga de Satoshi—y la fecha tiene un...