4 min lectura
Ideogram, un generador de imágenes de IA creado por antiguos ingenieros de Google, ha lanzado su primer conjunto de actualizaciones destinadas a hacer que la plataforma sea más funcional y utilizable. Las actualizaciones añaden capacidades para igualar mejor las ofertas de Stable Diffusion y Midjourney a un punto de precio convincente.
La primera versión pública de Ideogram en febrero ganó rápidamente popularidad entre los entusiastas de la IA como una alternativa sólida y capaz en comparación con Midjourney, Dall-E 3 y Stable Diffusion. Las pruebas realizadas por Decrypt encontraron que sobresalió en la comprensión de indicaciones, capacidades de generación de texto, conciencia espacial, cumplimiento de indicaciones, variedad de estilos, generación de personas y marcas, y calidad general en comparación con otros generadores de imágenes populares.
"Estamos emocionados de lanzar una importante actualización a Ideogram 1.0, nuestro modelo de texto a imagen más avanzado, junto con varias nuevas características, incluyendo 'describir' para la descripción de imágenes, indicación negativa y control de calidad y velocidad de renderizado de imágenes," señala el anuncio oficial.
“Describir” analiza una imagen y ayuda con la descripción; la "indicación negativa" le dice al modelo qué elementos debe evitar generar, y los controles de calidad y velocidad de renderizado de imágenes equilibran la calidad de salida con la eficiencia para aquellos que prefieren generaciones rápidas sobre detalladas. Esta última característica imita los modelos Turbo y LCM de Stable Difussion.
Sin embargo, estas actualizaciones tienen una condición: solo están disponibles para clientes de pago. Los usuarios gratuitos tendrán acceso al modelo, pero están limitados a generar hasta 25 lotes de 4 imágenes cada uno.
Aquellas personas ansiosas por probar estas funciones pueden actualizar al plan “Básico” por $7 al mes o pagar la versión “Plus” por $16. Los planes pagos también brindan a los usuarios acceso a otras ventajas como generaciones privadas, control de semillas, capacidades de inpainting y generaciones ilimitadas en modo lento.
La característica de “describir” es una adición significativa, especialmente para los usuarios básicos. Este asistente proporciona descripciones detalladas de cualquier imagen cargada, las cuales luego se pueden utilizar para generar indicaciones más precisas o descriptivas para que coincidan mejor con la referencia en iteraciones posteriores. Los usuarios pueden solicitar descripciones para cualquier imagen en el feed de Ideogram o sus propias imágenes cargadas desde un dispositivo local.
Ideogram ahora también permite a los usuarios cambiar entre tres opciones de renderizado: rápido, predeterminado y de calidad. El modo rápido prioriza la velocidad y genera imágenes en aproximadamente cinco segundos, mientras que el modo calidad prioriza los detalles más finos y genera imágenes en aproximadamente 20 segundos.
Mientras tanto, la función de indicación negativa, amplía las capacidades de edición de Ideogram. Esta herramienta permite a los usuarios especificar lo que no quieren ver en sus imágenes generadas, brindando más control sobre el resultado. Es una característica particularmente útil para refinar los resultados de la generación de texto a imagen, lo que permite obtener imágenes más precisas y relevantes en el primer intento.
Finalmente, Ideogram anuncia mejoras en el renderizado de texto y fotorrealismo. El equipo afirma que esta actualización reduce las tasas de error de texto en un 15% adicional en comparación con su modelo original. Además, los usuarios muestran una preferencia del 30-50% por las imágenes generadas con el modelo actualizado en comparación con el modelo inicial.
El equipo de Ideogram anunció por primera vez las mejoras el mes pasado durante una sesión de Discord, lo que generó un entusiasmo positivo temprano entre su comunidad de usuarios.
Con estas mejoras y las suscripciones mensuales de $7 a $16, Ideogram es un competidor sólido y rentable para una herramienta de inteligencia artificial generadora de imágenes. Para comparar, una suscripción de MidJourney cuesta entre $96 y $1152 al año, una suscripción de ChatGPT Plus, que brinda acceso a Dall-E 3, cuesta $20 al mes, y otros generadores de imágenes de IA como Leonardo AI y Maze Guru tienen suscripciones entre $10 y $25.
Por otro lado, para aquellos que no estén dispuestos a pagar por funciones premium, siempre estará Stable Diffusion, que además de ser de código abierto, es gratuito y ofrece funcionalidades similares, al menos para usuarios con computadoras más potentes.
Editado por Stacy Elliott y Ryan Ozawa.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.