En Resumen
- Stability AI retrasó el lanzamiento de Stable Diffusion XL (SDXL) debido a modelos mejorados que requieren más tiempo de evaluación.
- Los nuevos modelos tienen repercusiones técnicas en la afinación comunitaria e interacción con herramientas de la comunidad, como LoRAs.
- La filtración de la versión v0.9 de SDXL generó anticipación y expectativas, pero el retraso ha dejado al equipo ajustando planes antes del lanzamiento oficial.
La comunidad de arte de IA tendrá que contener su emoción un poco más. Stability AI, el creador de Stable Diffusion, el generador de imágenes de IA de código abierto más popular, ha anunciado un retraso en el lanzamiento de la tan esperada versión 1.0 de Stable Diffusion XL (SDXL), que se suponía que se lanzaría hoy.
La decisión de posponer el lanzamiento, revelada por Joe Penna de Stability AI, está causando revuelo en la comunidad de IA. El CEO de la compañía, Emad Mostaque posteriormente reveló en Discord que se tomarán "una semana o algo" para lanzar el modelo final.
"Tenemos algunos modelos 'tardíos' afinados que nos están sorprendiendo internamente, pero necesitamos más tiempo para tener una idea clara de cuál es mejor", explicó Penna en una publicación de Discord que ahora ha sido eliminada y que Decrypt pudo ver.
Añadió que cada modelo tiene "repercusiones técnicas bastante grandes" en la afinación comunitaria y la inferencia. Mientras la comunidad de arte de IA continúa esperando, Penna dijo que Stability AI está manejando tres nombres en código internos: Vanilla cream, Zi señor y Milky weights.
Esto significa, para aquellos que no están familiarizados con la escena, que básicamente Stability AI encontró nuevos modelos que proporcionan excelentes resultados, pero cada uno interactúa de manera diferente con LoRAs (Adaptaciones de Baja Rango) y otras herramientas de la comunidad.
Un LoRA es un archivo que cambia por completo la forma en que Stable Diffusion renderiza una imagen, haciendo que se comporte de la manera en que el artista espera. A diferencia de MidJourney y Dall-E, Stable Diffusion permite a las personas entrenar LoRAs para que el modelo cree imágenes de personas, estilos, entornos, ropa, niveles de detalle, etc., y estas modificaciones son las que hacen que Stable Diffusion se destaque frente a sus competidores.
Penna luego aclaró que el anuncio del retraso era particularmente pertinente para un servidor de Discord de afinadores que tenían LoRAs listos para ser lanzados. "Este mensaje estaba destinado solo para ellos. Anteriormente, asumíamos la interoperabilidad con 0.9", él compartió.
Si Stability AI lanza un modelo que no es compatible con algunos LoRAs que ya han sido entrenados (incluso si se utilizó la versión filtrada v0.9), entonces la curva de aprendizaje y la adopción del nuevo modelo podrían verse afectadas, y los usuarios también sufrirían las consecuencias.
Para contextualizar, Stable Diffusion v1.5 todavía se utiliza ampliamente en comparación con la menos popular Stable Diffusion v2.0, porque la versión más nueva era más difícil de usar y modificar.
Mientras tanto, la aún no lanzada SDXL v0.9 ya ha causado sensación entre los entusiastas del arte de IA. La versión v0.9, inicialmente destinada a pruebas en la nube y aún no destinada a su lanzamiento público, se filtró a principios de este mes y llegó a manos ansiosas del público.
"¿Estoy orgulloso de todos ustedes, o... lo contrario de orgulloso?", reflexionó Penna en un hilo de Reddit centrado en la filtración.
El floreciente mundo de los generadores de imágenes de IA deja poco espacio para la paciencia, y SDXL v0.9 no ha sido una excepción. Su distribución prematura sugiere un alto grado de anticipación por el lanzamiento oficial. Sin embargo, la necesidad abrupta de ajustar los planes ha dejado al equipo, como expresó el colega Alex Goodwin "implementar cosas antes del lanzamiento apresuradamente."
Ya sea visto como un contratiempo o una prolongación llena de suspenso, el retraso ciertamente ha mantenido a Stability AI en el centro de atención. En medio de las repercusiones causadas por el lanzamiento retrasado y la filtración sorpresa, el mundo espera ansiosamente el producto final que podría remodelar el panorama de la generación de imágenes de IA.