En Resumen

  • Alibaba Cloud, lanzó I2VGen-XL, una herramienta avanzada de texto a video que utiliza modelos de difusión en cascada para generar videos impresionantes.
  • El modelo se distingue en la carrera por la supremacía de la IA, enfrentándose a tensiones globales y competencia intensificada entre Estados Unidos y China.
  • Alibaba empleó un extenso conjunto de datos, 35 millones de pares de texto a video y 6 mil millones de pares de texto a imagen, asegurando la versatilidad y precisión del modelo.

Otro día, otro modelo de inteligencia artificial. Alibaba Cloud, subsidiaria del conglomerado chino Alibaba Group y una de las compañías de computación en la nube más grandes del mundo, ha presentado su nueva herramienta de IA I2VGen-XL. Es un sistema avanzado de texto a video que pretende competir contra modelos de última generación como los lanzados por Pika Labs o Stability AI.

La compañía anunció el viernes el lanzamiento de los pesos pesados del modelo después de publicar el artículo de investigación del modelo el mes pasado.

I2VGen-XL está diseñado utilizando modelos de difusión en cascada, explica el artículo, una sofisticada técnica de IA que garantiza que los videos generados sean visualmente impresionantes y también coherentes y precisos desde el punto de vista semántico.

Además, opera en un proceso de dos etapas: la etapa base se centra en mantener la coherencia con el texto de entrada y las imágenes, y la etapa de refinamiento mejora los detalles y la resolución del video, logrando hasta 1280x720 píxeles.

AD

Esta técnica puede sonar similar a las utilizadas para generar imágenes con SDXL. A diferencia de SD 1.5 y SD 2.1, que se basaban en un solo modelo, Stability AI desarrolló dos modelos diferentes, una base y un refinador, que deben combinarse para generar las imágenes de mejor calidad posible.

Alibaba Cloud dice que el entrenamiento del modelo utilizó un extenso conjunto de datos de alrededor de 35 millones de pares de texto a video y asombrosos 6 mil millones de pares de texto a imagen. Un conjunto de datos tan vasto asegura la versatilidad y precisión del modelo en diversos escenarios y temas.

Un nuevo modelo en medio de la carrera por la supremacía de la IA

Este lanzamiento se produce en un momento en que el panorama tecnológico global está presenciando tensiones y competencia intensificadas, especialmente entre Estados Unidos y China. En medio de restricciones comerciales y un impulso hacia la autosuficiencia tecnológica, el movimiento de Alibaba es oportuno y estratégicamente significativo para el país.

La última innovación de Alibaba no es un desarrollo aislado, sino parte de una narrativa más larga de rivalidad tecnológica. Con Estados Unidos imponiendo restricciones a las exportaciones de chips y China respondiendo con sus contramedidas, la carrera por la supremacía de la IA se ha acelerado. Este entorno ha impulsado avances en tecnologías nativas, con ambas naciones compitiendo por una posición líder en IA, tecnología de semiconductores e innovación 5G.

AD

Cuando se contrasta con otros avances destacados en el campo, como el modelo de Pika Labs y la Difusión de video estable, I2VGen-XL se distingue por su enfoque único y alta precisión semántica. Una demostración con varios ejemplos de uso de HiGen (un modelo de difusión) con I2VGen-XL, muestra una mejora significativa en la consistencia temporal y de cuadros en comparación con el uso de HiGen solo.

El modelo I2VGen-XL de Alibaba representa un hito importante en el panorama de la IA porque proporciona una alternativa a los modelos que están prohibidos para los usuarios chinos o podrían estar restringidos en el futuro por parte de los gobiernos de Estados Unidos o China.

Las apuestas de tecnología emergente de Alibaba

Alibaba va más allá del comercio electrónico. Ha sido un jugador importante en tecnologías emergentes durante un tiempo, impulsando constantemente nuevos desarrollos en los ámbitos de la IA, el metaverso, el software e incluso las monedas digitales.

Además de sI2VGen-XL, en la animación impulsada por IA, el modelo "Animate Anyone" de Alibaba se destaca de otros. Esta herramienta transforma imágenes estáticas en animaciones dinámicas, empleando un marco novedoso llamado ReferenceNet. La integración de modelos de difusión sofisticados logra videos temporalmente estables y visualmente consistentes.

Alibaba Cloud también se asoció con Avalanche para lanzar su plataforma Cloudverse. Esta tecnología ofrece a las empresas un camino sin problemas para crear y mantener sus universos digitales. La alianza estratégica con Avalanche y la participación de Metaverse Universal Assets DAO en soluciones de middleware destacan el enfoque colaborativo de Alibaba y su dedicación para aprovechar las tecnologías Web3.

Además, las ideas de Jack Ma sobre las monedas digitales apuntan al gran interés de Alibaba en el futuro de las finanzas globales. La defensa de Ma del papel transformador de las monedas digitales en el establecimiento de un nuevo sistema financiero se alinea con la creciente tendencia global hacia la digitalización en las finanzas.

El CEO de Alibaba se retrató a sí mismo como un escéptico de las criptomonedas, sin embargo, está lejos de ser un detractor de las cripto, ya que Alibaba lanzó un negocio de Blockchain como Servicio en medio del infame criptoinvierno del 2018.

Editado por Ryan Ozawa.

AD

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.