En Resumen
- Midjourney V7 fue probado internamente y presentado como una renovación completa del sistema anterior.
- Se exploraron funciones de generación de video y nuevos enfoques para hacerlo accesible y económico.
- Los usuarios recibieron mood boards avanzados y opciones de personalización para mejorar la creación de imágenes.
Midjourney está en las etapas finales de prueba de V7, una actualización significativa que reconstruye casi todas las partes del sistema del generador de imágenes de IA.
Durante la sesión de office hours de esta semana, los desarrolladores explicaron que V7 presenta una nueva arquitectura, diferentes conjuntos de datos y enfoques revisados de procesamiento de lenguaje.
Las pruebas internas podrían tomar de una semana a un mes, seguidas de una fase de ajuste de dos semanas y un potencial período alfa con características limitadas.
"El modelo V7 es una renovación completa de V6, incluyendo nueva arquitectura, diferentes conjuntos de datos y enfoques revisados de procesamiento de lenguaje", anunció Midjourney en su servidor oficial. "Un período alfa suele seguir al ajuste inicial, con características limitadas habilitadas".
Mientras continúa el extenso trabajo de renovación de V7, el equipo de Midjourney también está explorando capacidades de generación de video a través de múltiples enfoques, incluyendo el desarrollo de su propio modelo de video o la asociación con proveedores externos.
El principal desafío, según el equipo, radica en hacer que la creación de video sea tanto fácil de usar como rentable.
El equipo no reveló un cronograma específico para este generador de video, por lo que podría estar en una fase de desarrollo más temprana. En este momento, los desarrolladores están trabajando en "equilibrar la velocidad, el costo y la calidad de salida", según el anuncio.
Alrededor del 85% de los usuarios prefieren las imágenes generadas utilizando el sistema de personalización de la plataforma, que ahora incluye mood boards y múltiples perfiles, dijo Midjourney. La compañía planea expandir estas características combinando mood boards con capacidades de referencia de estilo.
La plataforma también planea introducir dos modos de generación distintos: una opción en "tiempo real" para resultados rápidos similar a la función "imagine" de Meta, la función doodle-to-image de Krea AI, o el Realtime Canvas de Leonardo.
También están trabajando en un modo de alta capacidad para crear grandes lotes de imágenes similar al estado Flow de Leonardo.
Midjourney V6 fue lanzado en diciembre de 2023 y proporcionó mejores resultados que su predecesor inmediato, Midjourney V5.1, lanzado en mayo de 2023.
Los resultados fueron notables, pero el paso de V5 a V6 no fue tan grande como la actualización de V4 a V5. Midjourney fue más cauteloso al hablar sobre V6, por lo que es razonable pensar que el equipo está muy satisfecho con los resultados al punto de llamar a esta nueva versión una "renovación completa".
Durante ese tiempo, el equipo también anunció que estaban entrando en el mercado de hardware de IA, pero aún no han revelado más detalles.
Desde el lanzamiento de Midjourney V6, el equipo ha expandido sus capacidades, agregando características como un editor de imágenes, una interfaz independiente, una herramienta de personalización de estilo, outpainting y expansión de imágenes, entre otras.
El equipo también comenzó a prestar atención a los comentarios de los usuarios, compartiendo diferentes encuestas para preguntar qué características quieren implementar.
Help us plan our roadmap over the next 12 months. Submit your ideas here: https://t.co/TuxV2p6UyI and we'll pool your thoughts together with our own and then put up a voting board to get a sense of what everyone would find most valuable. Thank you!
— Midjourney (@midjourney) November 1, 2024
Según el análisis de Decrypt, Midjourney actualmente sobresale en la generación creativa de imágenes de IA, produciendo consistentemente resultados altamente estéticos que destacan entre sus competidores.
Si bien ocasionalmente puede sacrificar la adherencia estricta al prompt y la precisión en la renderización de texto, su versatilidad y capacidades generales lo convierten en una herramienta poderosa.
La adición de estilos personalizables ha mejorado aún más su atractivo, permitiendo a los usuarios crear imágenes únicas y personalizadas que difieren mucho del aspecto distintivo de la plataforma.
Editado por Sebastian Sinclair.