En Resumen

  • Hugging Face fue reconocido como Proyecto del Año 2024 por su impacto en la democratización de la inteligencia artificial.
  • La empresa amplió sus colaboraciones con Microsoft, Google y Nvidia, destacándose en la IA de código abierto.
  • Hugging Face enfrentó críticas en noviembre tras eliminar un conjunto de datos creado sin consentimiento en Bluesky.

En un mundo cada vez más moldeado por la inteligencia artificial, pocas empresas han dejado una huella en 2024 como el proyecto de código abierto Hugging Face.

Lo que comenzó como una aplicación de chatbot ha evolucionado hasta convertirse en un centro de inteligencia artificial de código abierto, convirtiéndose en un recurso indispensable tanto para investigadores, desarrolladores y empresas por igual. Para 2023, tras varias rondas de inversión, Hugging Face fue valorado en $4.500 millones.

Hugging Face es el Proyecto del Año 2024 de Emerge por su papel transformador en la inteligencia artificial y su dedicación a democratizar el aprendizaje automático. Con un liderazgo visionario, herramientas de código abierto y un fuerte enfoque en la ética, capacita a investigadores y startups en todo el mundo. Gracias también a una próspera comunidad en línea de entusiastas de la inteligencia artificial de código abierto, Hugging Face se ha convertido en un estandarte de innovación en inteligencia artificial responsable y colaborativa.

¿Qué es Hugging Face?

Hugging Face, fundada en 2016 por los empresarios franceses Clément Delangue, Julien Chaumond y Thomas Wolf y con sede en la ciudad de Nueva York, es una plataforma de código abierto para el machine learning y el procesamiento de lenguaje natural.

Con una enorme biblioteca de más de un millón de modelos de IA, 190.000 conjuntos de datos y 55.000 aplicaciones de demostración, Hugging Face permite a los desarrolladores, investigadores y científicos de datos construir, entrenar, compartir e implementar modelos de IA.

“Comenzamos como una empresa de juegos, y descubrimos que podríamos tener un impacto mucho mayor al comenzar a abrir parte de nuestro código de investigación. Eso nos llevó a nuestra biblioteca de transformers y ver el impacto y la emoción al respecto en la comunidad”, dijo el cofundador y Director de Ciencia, Wolf, a Decrypt. “Creemos que el código abierto es el enfoque clave para democratizar el aprendizaje automático."

En su núcleo se encuentra la biblioteca de transformers, que ofrece modelos pre-entrenados de última generación para una amplia gama de tareas. Los usuarios pueden explorar los modelos a través de widgets de inferencia basados en el navegador, acceder a ellos a través de API e implementarlos en entornos informáticos. Hugging Face también fomenta la colaboración al permitir a los usuarios compartir y ajustar los modelos a través de su Hub, un repositorio central donde los usuarios pueden experimentar y contribuir a modelos de IA de vanguardia.

"Fine-tuning" o "Ajuste Fino" en IA se refiere a tomar un modelo de IA preentrenado, que contiene pesos y características aprendidas de conjuntos de datos iniciales para entrenar el modelo, y adaptarlo para realizar una tarea específica o mejorar el rendimiento en un conjunto de datos especializado.

“La ciencia abierta y la IA de código abierto evitan sistemas de caja negra, hacen que las empresas sean más responsables y ayudan a [resolver] los desafíos actuales, como mitigar los sesgos, reducir la desinformación, promover los derechos de autor y recompensar a todas las partes interesadas, incluidos artistas y creadores de contenido, en el proceso de creación de valor", dijo el cofundador y CEO Delangue en X (anteriormente Twitter).

Democratizando la IA

Un refrán común en la comunidad descentralizada y de código abierto es "democratizar la IA", o empoderar a las personas para utilizar la IA para el bien social, la innovación y la resolución de problemas complejos sin el control de corporaciones y gobiernos.

En una industria dominada por tecnologías propietarias y ecosistemas cerrados, Hugging Face se destaca por poner herramientas de vanguardia a disposición de forma gratuita para la comunidad global de IA. Delangue reiteró el compromiso de Hugging Face con la causa de democratizar la IA durante una audiencia del Congreso de junio de 2023 del Comité de Ciencia, Espacio y Tecnología.

“Hugging Face es una empresa orientada a la comunidad con sede en los EE. UU. con la misión de democratizar el buen machine learning”, dijo Delangue durante la audiencia. “Llevamos a cabo nuestra misión principalmente a través del código abierto y la ciencia abierta, con nuestra plataforma para alojar modelos y conjuntos de datos de machine learning, y una infraestructura que apoya la investigación y los recursos para reducir la barrera para que todas las personas contribuyan a la IA.”

La democratización de la IA es particularmente impactante en regiones e industrias subrepresentadas, donde los investigadores y las pequeñas empresas a menudo carecen de los recursos para competir con los gigantes tecnológicos.

“Las divisiones de recursos de larga data y cada vez más amplias, especialmente entre la industria y la academia, limitan quién puede contribuir a la investigación y aplicaciones innovadoras”, dijo Delangue al Congreso. “Apoyamos firmemente el Recurso Nacional de Investigación en IA de los EE. UU. y el financiamiento de pequeñas empresas y startups que realizan investigaciones de interés público.”

Colaboración sobre competencia

Enfatizando el espíritu colaborativo de Hugging Face, la empresa ha trabajado con otros grandes nombres en IA, incluidos Google, AWS, Meta, Nvidia y Microsoft.

En enero, Hugging Face se asoció con Google Cloud al combinar sus propios modelos abiertos con la infraestructura de Google, todo con el objetivo de hacer que la IA sea más accesible. Ese mismo mes, Hugging Face presentó su Leaderboard de Alucinaciones, que la empresa lanzó para abordar el problema continuo de las alucinaciones de IA.

“El desafío ahora es tener suficientes startups y equipos listos para implementar modelos en varios verticales,” dijo Wolf. “No es necesario esperar a GPT-5; es hora de construir aplicaciones de IA ahora aprendiendo cómo usar, evaluar y adaptar estos modelos en el mundo actual.”

En mayo, Hugging Face amplió su asociación con Microsoft que comenzó en 2022, proporcionando a los desarrolladores una infraestructura y herramientas más amplias para crear versiones más potentes de sus modelos de IA Copilot. Más tarde ese mes, Amazon anunció una nueva alianza con Hugging Face para facilitar a los desarrolladores ejecutar modelos de IA utilizando los chips informáticos de Amazon.

En julio, el fabricante de chips informáticos Nvidia anunció una colaboración con Hugging Face, que llevaría sus servicios de inferencia acelerados por Nvidia a la plataforma de código abierto, permitiendo a los desarrolladores implementar modelos de IA como Llama 3 con un procesamiento de tokens hasta cinco veces más rápido.

En octubre, Hugging Face lanzó HuggingChat, la respuesta de la plataforma a ChatGPT de OpenAI. HuggingChat permite a los usuarios elegir entre una diversa selección de modelos de IA de código abierto para sus capacidades de generación de texto. Esto fue seguido por el lanzamiento de Hugging Face Generative AI Services, o HUGS, que permite a los desarrolladores implementar y entrenar modelos de IA sin conexión en un entorno personalizado.

En la Conferencia de Robot Learning en Alemania en noviembre, Hugging Face y NVIDIA anunciaron una asociación para impulsar la robótica de código abierto, combinando la plataforma de robótica de Hugging Face LeRobot con las herramientas de IA de NVIDIA para mezclar la simulación y el entrenamiento en el mundo real, todo con el objetivo de hacer que los robots sean más inteligentes y efectivos.

Sin embargo, no todo ha sido un camino de rosas para Hugging Face. En noviembre, la empresa enfrentó críticas después de que se revelara que se creó un conjunto de datos con más de un millón de publicaciones utilizando contenido extraído de la plataforma de redes sociales en ascenso Bluesky antes de ser eliminado al día siguiente.

“He eliminado los datos de Bluesky del repositorio. Aunque quería apoyar el desarrollo de herramientas para la plataforma, reconozco que este enfoque violaba los principios de transparencia y consentimiento en la recopilación de datos,” escribió Daniel van Strein, Bibliotecario de Aprendizaje Automático de Hugging Face, en Bluesky. “Pido disculpas por este error.”

El futuro de Hugging Face

Entrando en 2025, el CEO de Hugging Face presentó sus predicciones para el próximo año en IA, incluyendo la primera gran protesta pública relacionada con la IA, la reducción a la mitad de la capitalización de mercado de una empresa importante debido a la IA, y más de 100.000 robots personales de IA disponibles para preordenar.

“Comenzaremos a ver el potencial de crecimiento económico y de empleo de la IA, con 15 millones de constructores de IA en Hugging Face,” tuiteó Delangue.

Wolf compartió una visión igualmente optimista del futuro de la IA y la robótica de código abierto al entrar en 2025, señalando hacia modelos más eficientes en energía, de código abierto.

“Muchas cosas me emocionan sobre el futuro, pero para nombrar solo algunas,” dijo Wolf. “Modelos más pequeños que pueden ser mucho más eficientes energéticamente, el auge de la robótica de código abierto y la extensión de todas las herramientas que hemos descubierto en IA al campo de la ciencia, por ejemplo, la predicción del clima y el descubrimiento de materiales.”

Hugging Face jugó un papel fundamental en la evolución de la IA en 2024 al impulsar la innovación, la accesibilidad global y la transparencia al tiempo que reduce las barreras para que las startups y los desarrolladores creen una multitud de soluciones de IA.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.