10 min lectura
Leonardo AI, un popular servicio de imágenes generativas, anunció recientemente el lanzamiento de su nuevo modelo, Leonardo Phoenix. Este lanzamiento llega poco después del lanzamiento de su modelo SD3 por parte de Stability AI, que ofreció una impresionante adherencia a las indicaciones y capacidades de generación de texto, pero fue empañado por la controversia en torno a sus términos de licencia y un malentendido de la anatomía humana.
Los creadores de Leonardo estaban, como era de esperar, entusiastas sobre su último lanzamiento.
“No queremos exagerar esto, pero realmente creemos que Phoenix es uno de los principales modelos en cuanto a su capacidad para seguir fielmente las indicaciones de un usuario," escribieron en un anuncio por correo electrónico. La actualización del modelo de IA vino con una renovación del sitio web de Leonardo.
Leonardo Phoenix se promociona como un modelo que ofrece una mejor adherencia rápida, texto claro y preciso dentro de las imágenes, calidad de imagen superior y un mayor control creativo. La actualización también introduce nuevas funciones como "Mejora de las sugerencias" y "Editar con IA", las cuales ayudan a los usuarios a convertir automáticamente sugerencias básicas en más detalladas e instruir a la IA para cambiar las sugerencias de formas específicas, respectivamente.
Sin embargo, debido a la nueva arquitectura, algunas funciones anteriormente disponibles como la guía de imágenes, elementos y fotorealismo aún no son compatibles. También es importante tener en cuenta que los costos de tokens son temporalmente más bajos para el nuevo modelo, pero volverán a los precios estándar el próximo lunes.
Si bien los modelos de Stable Diffusion requieren que los usuarios tengan los conocimientos técnicos para instalarlos en sus computadoras locales, Leonardo AI es fácilmente accesible a través de su propio sitio web. Esta facilidad de uso invita a una comparación natural con Ideogram, MidJourney o Dall-E 3, que también son generadores de imágenes de IA basados en la web.
Antes del lanzamiento de Leonardo Phoenix, Decrypt comparó estos modelos—de manera local y utilizando la versión web—y concluyó que "Ideogram puede ser el mejor generador de imágenes actualmente en el mercado." Cuando salió SD3, nuestra prueba rápida concluyó que era "mejor que SDXL para muchos casos de uso, pero no lo suficiente como para reemplazarlo."
Ideogram se mantuvo fuerte en nuestras pruebas subjetivas, pero ¿será Leonardo lo suficientemente bueno para vencerlo?
Para comparar los modelos, proporcionamos el mismo prompt base a ambos. También activamos una función disponible en ambos servicios para mejorar nuestro prompt y generar mejores imágenes.
Prompt Base: Un hombre y una mujer cenando en un restaurante futurista, ilustración al estilo de Vincent Van Gogh. El restaurante tiene un letrero que dice "Welcome to Emerge, by Decrypt."
Queríamos probar qué tan bien los modelos identifican artistas relevantes y movimientos artísticos, en este caso, el estilo artístico de Vincent Van Gogh, quien tiene una técnica característica y fácilmente reconocible. Leonardo supera a Ideogram en cuanto al estilo. Además, sus capacidades de generación de texto resultaron más poderosas en este ejemplo.
El enfoque de Leonardo en el estilo llevó a la fusión del restaurante con el pasto en un picnic.
Ideogram optó por un enfoque más seguro, centrándose en la escena en lugar del estilo. Es más fácil corregir la generación de Leonardo con inpaint. Ideogram requeriría técnicas más sofisticadas (como el uso de IPAdapter o Img2Img) para lograr resultados aceptables porque la imagen no se asemeja en absoluto al estilo.
Ganador: Leonardo
Prompt Base: Un perro parado sobre un gato. A la izquierda, hay un robot con una pantalla que dice “Emerge”, a la derecha hay un doctor de temática de terror con una jeringa que lleva una máscara de gas. El fondo mezcla elementos de tecnologías emergentes como ADN y genética, código binario, exploración espacial y extraterrestres, electrónica y tecnología futurista.
Aquí queríamos probar qué tan bien los modelos comprenden la posición de elementos específicos en la indicación. Ambos fueron precisos en sus generaciones, entendiendo la posición de cada elemento solicitado, el fondo y el texto.
Ideogram generó una imagen que combina todos los elementos y es más estéticamente agradable. Leonardo generó una representación más precisa, lo cual es evidente en los pequeños detalles. Por ejemplo, Ideogram no logró generar buenas manos para el doctor, y los elementos en la mesa no son más que generaciones abstractas desordenadas que lucen bien pero no significan nada.
Ganador: Empate. Leonardo gana en términos de precisión, Ideogram gana en términos de estética.
Ronda de bonificación: Decidimos comenzar con esta generación para probar la función "Editar con IA" de Leonardo. Le pedimos a Leonardo que "diera a la imagen un estilo vintage de los años 70 sin cambiar sus elementos", y lo generó casi perfectamente en el primer intento, solo faltaba el gato.
Es importante destacar que esta función modificó en gran medida la generación y no es simplemente comparable al uso de IPAdapters en Stable Diffusion.
Prompt Base: foto profesional, primer plano de un hombre caucásico, vistiendo un suéter negro, rostro serio, iluminación dramática, naturaleza, sombrío, clima nublado, bokeh.
La imagen de Ideogram era más fotorrealista que la de Leonardo. Se centró en el sujeto y todas sus características, mientras que Leonardo, nuevamente, se centró más en el estilo y otros elementos que rodean al sujeto como la estética sombría y la iluminación dramática.
Ganador: Ideogram
Tanto Ideogram como Leonardo son sitios web que permiten al público acceder a sus respectivos modelos de IA generativa. También ofrecen niveles de pago que mejoran sus capacidades. Si bien las comparaciones de imágenes son convincentes, también vale la pena examinar los detalles técnicos. Después de todo, el factor decisivo podría ir más allá de los modelos mismos, abarcando las ofertas de servicios generales de cada uno.
Leonardo proporciona una interfaz de usuario completa con una amplia gama de funciones diseñadas para usuarios que buscan extraer el máximo valor de sus imágenes generadas. La integración de procesamiento de lenguaje natural para una edición rápida y manipulación de generación también es una ventaja significativa. Para usuarios avanzados, especialmente aquellos dispuestos a invertir en servicios premium, Leonardo es claramente la opción más convincente, especialmente dada su extenso conjunto de funciones.
Sin embargo, para los usuarios casuales centrados principalmente en generar imágenes visualmente impresionantes con un esfuerzo mínimo, el enfoque simplificado de Ideogram, junto con sus capacidades de generación de sugerencias mejoradas por IA, puede resultar más adecuado.
Si bien Leonardo parece mostrar una ligera ventaja en la generación de cadenas de texto más largas dentro de las imágenes, la diferencia no es sustancial.
En última instancia, la decisión entre los dos servicios puede depender de las prioridades individuales, siendo Leonardo el mejor para aquellos que buscan un control creativo integral y herramientas avanzadas, mientras que Ideogram atrae a los usuarios que priorizan una experiencia de generación de imágenes optimizada pero sencilla.
En nuestra opinión, Leonardo realmente le quita la corona a Ideogram. Si bien Ideogram a veces puede generar imágenes superiores, la cantidad de funciones que proporciona Leonardo es convincente. Ya seas nuevo en las imágenes generativas o un profesional, Leonardo puede cumplir tus espectativas.
Ganador General: Leonardo
Editado por Ryan Ozawa.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.