3 min lectura
En el próspero mundo de los generadores de imágenes de IA, la paciencia aparentemente es una virtud elusiva. Los entusiastas ansiosos de Stable Diffusion, posiblemente el generador de imágenes de código abierto más popular en línea, están evitando la espera para el lanzamiento oficial de su última versión, Stable Diffusion XL v0.9, que se filtró en línea este jueves en la noche.
La versión, destinada a pruebas en la nube que aún no esperaba ser lanzada por parte del creador Stability AI, encontró su camino al público y comenzó a propagarse rápidamente. Joe Penna, miembro del creador Stability AI, expresó un sentimiento mixto.
"¿Estoy orgulloso de todos ustedes o... lo contrario de orgulloso?" reflexionó en un hilo de subreddit centrado en la filtración.
Estas características pueden atraer a cualquiera que busque gráficos de alta calidad sin tener que gastar cerca de $100 al año en MidJourney. También requiere indicaciones menos complejas para proporcionar resultados de calidad.
Sin embargo, hay una advertencia sobre la adquisición clandestina de Stable Diffusion XL v0.9. El torrente consume un enorme espacio de 91.3 GB, aunque tener el modelo base y el refinador debería ser suficiente para las operaciones. Además, no se lleva bien con las interfaces predominantes, y la mejor opción para probarlo actualmente es a través de Comfy UI, una interfaz ligera pero menos intuitiva basada en nodos.
Stability AI, está tratando de ponerse al día. En un intento por recuperar el control, la empresa ha cerrado una versión de Stable Diffusion XL v0.9 en la comunidad de IA Huggingface. Desafortunadamente para Stability AI, el modelo ya se ha descentralizado a través de un torrent, por lo que será difícil detener su propagación.
Este nuevo modelo viene con un par de inconvenientes. Muchos complementos integrales para el éxito de Stable Diffusion 1.5, como LoRAs, Lycoris, Lohas, Controlnet y otros, parecen ser incompatibles con este modelo. Además, una vez que se genera una imagen con el modelo base, se necesita un proceso de refinamiento para obtener una imagen final óptima.
Sin embargo, estos problemas no han disminuido el entusiasmo. La calidad visual del modelo, entrenado a una resolución de 1024x1024 en comparación con los 512x512 de la versión 1.5, y la calidad estética de las imágenes generadas por el modelo XL ya están generando respuestas entusiasmadas por parte de los usuarios.
En una comunidad tan vibrante, es solo cuestión de tiempo antes de que todas las miradas se vuelvan hacia esta nueva época en el arte generativo, y parece que el caos alrededor de la filtración ha provocado involuntariamente un frenesí creativo entre los usuarios.
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.