En Resumen
- Meta presenta CM3leon, un modelo de texto a imagen que promete un rendimiento de vanguardia en generación de imágenes.
- CM3leon marca un avance en la capacidad de IA de Meta, generando imágenes realistas y escribiendo leyendas coherentes.
- Meta está intensificando sus esfuerzos en IA, aprovechando su equipo de ciencia de datos y su infraestructura informática para desarrollar modelos avanzados.
Meta está intensificando agresivamente sus esfuerzos de inteligencia artificial en un intento por alcanzar a rivales como Google, Microsoft y OpenAI. El gigante de las redes sociales ha presentado un nuevo modelo de texto a imagen llamado CM3leon que afirma lograr un rendimiento de vanguardia para generar imágenes a partir de indicaciones de texto. Pero aún no está disponible para pruebas o uso comercial.
CM3leon marca un avance en las capacidades de IA de Meta. El modelo no solo puede generar imágenes de alta fidelidad a partir de descripciones de texto, sino que también puede escribir leyendas coherentes para imágenes existentes. Esto sienta las bases para modelos de comprensión de imágenes más avanzados en el futuro.
Meta está aprovechando su formidable equipo de ciencia de datos y su infraestructura informática para avanzar en modelos de vanguardia como CM3leon.
Mientras que la IA basada en difusión, como la de MidJourney, ha acaparado titulares, Meta apuesta por arquitecturas transformadoras autoregresivas (la misma tecnología utilizada por ChatGPT). La compañía afirma que CM3leon necesita 5 veces menos capacidad de entrenamiento que otros métodos comparables.
En comparaciones directas, CM3leon parece manejar mejor objetos complejos y restricciones en indicaciones de texto que modelos como DALL-E 2 de OpenAI e incluso Midjourney. Las imágenes compartidas por Meta muestran que su nuevo generador de texto a imagen es capaz de representar con precisión la anatomía humana (sin más manos de espagueti) e incluso puede renderizar texto preciso (sin más palabras aleatorias en imágenes de IA).
CM3leon también ofrece imágenes avanzadas que permiten a los usuarios crear representaciones más precisas de sus ideas: Texto a imagen, imagen a imagen, edición de imagen guiada por estructura, objeto a imagen, segmentación a imagen y mejora de resolución son algunas características que no están disponibles en ningún otro generador que no sea Stable Diffusion utilizando Controlnet.
Rumores de un nuevo LLM
Meta también planea lanzar una versión comercial de su modelo de lenguaje natural LLaMA para desarrolladores externos, según fuentes citadas por el Financial Times. Si esto es cierto, permitirá a las startups y empresas construir aplicaciones personalizadas impulsadas por la IA de Meta, poniendo al gigante de las redes sociales en competencia directa con ChatGPT (OpenAI-Microsoft), Bard (Google) y Claude v2 (Anthropic-Google).
El enfoque de Meta parece estar girando fuertemente hacia la IA en todas sus aplicaciones, a pesar de que ha afirmado estar también muy enfocado en sus proyectos de metaverso.
A principios de este año, la compañía estableció una unidad dedicada a la IA generativa liderada por el Director de Producto Principal Chris Cox. Meta también está trabajando en herramientas de IA que generan anuncios mejores para dirigirse a los usuarios.
Al abrir modelos clave como el LLaMA LLM filtrado (el LLM de código abierto más grande y avanzado del mundo), Meta tiene como objetivo catalizar la innovación de desarrolladores de todo el mundo para mejorar la tecnología. Esto contrasta con el enfoque cerrado de competidores como OpenAI. Sin embargo, la monetización de los modelos de Meta sigue siendo una posibilidad a futuro.
La avalancha de actividad de IA se produce mientras Meta lucha con el valor en caída de sus acciones y las controversias en torno a la privacidad y la desinformación derivadas de la actividad en Facebook, que sigue siendo la plataforma más grande de la empresa. El CEO de Meta, Mark Zuckerberg, cree que esta fuerte inversión en IA generativa se alinea con la visión de la empresa para el metaverso y podría abrir nuevas fuentes de ingresos.
Recientemente, Meta lanzó Threads, un clon de Twitter que está experimentando un rápido crecimiento de usuarios, superando lo logrado por OpenAI después del lanzamiento de ChatGPT. También ha demostrado ser hábil en tomar elementos clave de tecnologías anteriores, mejorarlos y crear productos exitosos que casi eliminan a sus competidores en el terreno que crearon.
Con nuevos modelos como CM3leon que muestran un rendimiento prometedor, Meta parece decidida a perseguir agresivamente la IA para remodelar su futuro, después de dejar a los inversores poco impresionados con sus esfuerzos en el metaverso. La carrera por liderar la IA generativa acaba de tener un nuevo competidor.