Encuesta Revela Preferencias Por la Inteligencia Artificial de Código Abierto

El modelo de código abierto Mixtral 8x7B de Mistral AI se lleva los máximos honores entre opciones cerradas y propietarias como Claude y ChatGPT.

Por Jose Antonio Lanz

Jan 11, 2024

3 min lectura

Image created by Decrypt using AI

En Resumen

Una encuesta en curso a más de 100.000 personas reveló que los entusiastas de la inteligencia artificial prefieren trabajar con herramientas de código abierto en lugar de las comerciales propietarias.
El modelo de código abierto Mixtral 8x7B de Mistral AI ha tenido un impacto significativo en el espacio de la inteligencia artificial, superando a modelos comerciales propietarios en la clasificación de Chatbot Arena.
Mixtral, basado en la arquitectura de 'Mezcla de Expertos' (MoE), ha destacado por su rendimiento en varias pruebas de referencia y su competencia multilingüe.

Los entusiastas de la inteligencia artificial prefieren trabajar con herramientas de código abierto en lugar de las comerciales propietarias, según una encuesta en curso de más de 100.000 encuestados.

La aparición del modelo de código abierto Mixtral 8x7B de Mistral AI ha tenido un impacto significativo en el espacio de la IA. Ligero y potente, Decrypt lo incluyó entre los Mejores LLMs de 2023. Mixtral ha llamado la atención por su notable rendimiento en varias pruebas de referencia, especialmente en Chatbot Arena, que ofrece un enfoque único centrado en el ser humano para evaluar LLMs.

La clasificación de Chatbot Arena, una lista colaborativa, aprovecha más de 130.000 votos de usuarios para calcular las clasificaciones Elo de los modelos de IA. En comparación con otros métodos que intentan estandarizar los resultados para que sean más objetivos, Arena opta por un enfoque más "humano", pidiendo a las personas que elijan entre dos respuestas proporcionadas por LLMS no identificados a ciegas. Estas respuestas pueden parecer poco convencionales según ciertos estándares, pero pueden ser evaluadas intuitivamente por usuarios humanos reales.

Mixtral tiene una posición impresionante, superando a gigantes de la industria como Claude 2.1 de Anthropíc, GPT-3.5 de OpenAI, que alimenta la versión gratuita de ChatGPT, y Gemini de Google, un LLM multimodal que se vendió como el chatbot más poderoso para desafiar el dominio de GPT-4.

Clasificación de Chatbot Arena. El LLM de Mistral AI ocupa el puesto 6 en la lista. Imagen: Huggingface

Una de las diferencias destacadas de Mixtral es ser el único LLM de código abierto en el top 10 de la Arena de Chatbots. Esta distinción no es solo una cuestión de clasificación; representa un cambio significativo en la industria de la IA hacia modelos más accesibles y basados en la comunidad.

Como informó Decrypt, Mistral AI dijo que su modelo "supera a LlaMA 2 70B en la mayoría de los puntos de referencia con una inferencia 6 veces más rápida y coincide o supera a GPT 3.5 en la mayoría de los puntos de referencia estándar", como MMLU, Arc-C o GSM.

El secreto detrás del éxito de Mixtral radica en su arquitectura de 'Mezcla de Expertos' (MoE). Esta técnica utiliza múltiples modelos virtuales de expertos, cada uno especializado en un tema o campo específico. Cuando se enfrenta a un problema, Mixtral selecciona los expertos más relevantes de su grupo, lo que conduce a resultados más precisos y eficientes.

"En cada capa, para cada token, una red de enrutamiento elige dos de estos grupos (los 'expertos') para procesar el token y combinar su salida de manera aditiva", explicó Mistral en el reciente artículo publicado en LLM. "Esta técnica aumenta el número de parámetros de un modelo al tiempo que controla el costo y la latencia, ya que el modelo solo utiliza una fracción del conjunto total de parámetros por token."

Además, Mixtral se destaca por su competencia multilingüe. El modelo sobresale en idiomas como francés, alemán, español, italiano e inglés, mostrando su versatilidad y su amplio potencial. Su naturaleza de código abierto, bajo la licencia Apache 2.0, permite a los desarrolladores explorar, modificar y mejorar el modelo libremente, fomentando un entorno colaborativo e innovador.

El éxito de Mixtral claramente no se trata solo de habilidades tecnológicas; marca una pequeña pero importante victoria para la comunidad de IA de código abierto. Quizás, en un futuro no tan lejano, la pregunta no será sobre qué modelo llegó primero, o cuál tiene más parámetros o capacidades de contexto, sino cuál realmente resuena con las personas.

Editado por Ryan Ozawa.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.

Noticias recomendados

Meta Invierte $14.000 Millones en Scale AI Para 'Profundizar' su Trabajo en Superinteligencia
La empresa tecnológica multinacional estadounidense Meta ha realizado una inversión significativa en Scale AI, la startup de etiquetado de datos esencial para el entrenamiento de sistemas de inteligencia artificial, reclutando a su joven fundador Alexandr Wang para desarrollar un laboratorio de "superinteligencia" centrado en lograr la inteligencia artificial general (AGI). Mediante la inversión de $14.300 millones, Meta adquirió una participación del 49% en Scale AI, elevando su valoración a má...
NoticiasArtificial Intelligence
4 min lectura
Vince DioquinoJun 16, 2025
Create an account to save your articles.
Fabricante de Juguetes Hot Wheels y Barbie Utilizará Tecnología de OpenAI Para Aumentar su Poductividad
El gigante de los juguetes Mattel anunció el jueves que se asociará con el gigante de la inteligencia artificial OpenAI para crear los primeros productos impulsados por IA de una importante empresa de juguetes, marcando la expansión de OpenAI más allá del software empresarial hacia el entretenimiento para consumidores. La colaboración utilizará la tecnología de OpenAI para desarrollar nuevos productos para las marcas de Mattel, y se espera que el primer producto impulsado por IA de las compañías...
NoticiasArtificial Intelligence
3 min lectura
Vismaya VJun 16, 2025
Create an account to save your articles.
Startup Española Recauda $215 Millones Prometiendo Reducir 95% Los Modelos de IA Sin Perder Rendimiento
Una startup de inteligencia artificial española acaba de convencer a los inversores de entregar $215 millones basándose en una afirmación audaz: pueden reducir los Large Language Models (LLMs) en un 95% sin comprometer su rendimiento. La innovación de Multiverse Computing se basa en su tecnología CompactifAI, un método de compresión que toma prestados conceptos matemáticos de la física cuántica para reducir los modelos de IA al tamaño de un smartphone. La empresa de San Sebastián dice que su mod...
NoticiasArtificial Intelligence
4 min lectura
Jose Antonio LanzJun 15, 2025
Create an account to save your articles.

Coin Prices