Leyendo

Microsoft Apuesta Por la Potencia en su Nuevo Modelo de IA Pequeño "Phi-2"

El tamaño no lo es todo en los modelos de lenguaje de inteligencia artificial, ya que el último lanzamiento de Redmond se enfrenta a competidores 25 veces más grandes.

Por Jose Antonio Lanz

Dec 13, 2023

3 min lectura

Image: Shutterstock

Microsoft Research ha anunciado el lanzamiento de Phi-2, un modelo de lenguaje pequeño o small language model (SLM) que demuestra capacidades notables para su tamaño. El modelo fue revelado por primera vez durante el evento Ignite 2023 de Microsoft, en el que Satya Nadella, CEO de Microsoft, destacó su capacidad para lograr un rendimiento de vanguardia con una fracción de los datos de entrenamiento.

A diferencia de GPT, Gemini y otros modelos de lenguaje grandes o Large Language Models (LLM), un SLM se entrena con un conjunto de datos limitado, utilizando menos parámetros y requiriendo menos cálculos para funcionar. Como resultado, el modelo no puede generalizar tanto como un LLM, pero puede ser muy bueno y eficiente en tareas específicas, como matemáticas y cálculos en el caso de Phi.

Phi-2, con sus 2.700 millones de parámetros, muestra un buen razonamiento y comprensión del lenguaje, rivalizando con modelos hasta 25 veces su tamaño, según Microsoft. Esto se debe al enfoque de Microsoft Research en datos de entrenamiento de alta calidad y técnicas avanzadas de escalado, lo que produce un modelo que supera a sus predecesores en varios puntos de referencia, incluyendo matemáticas, programación y razonamiento de sentido común.

"Con solo 2.7 mil millones de parámetros, Phi-2 supera el rendimiento de los modelos Mistral y Llama-2 con 7B y 13B de parámetros en varios puntos de referencia agregados", dijo Microsoft, lanzando un golpe bajo al nuevo modelo de IA de Google: "Además, Phi-2 iguala o supera al recientemente anunciado Google Gemini Nano 2, a pesar de ser más pequeño en tamaño".

Gemini Nano 2 es la última apuesta de Google en un multimodal LLM capaz de funcionar localmente. Fue anunciado como parte de la familia Gemini de LLMs que se espera que reemplacen a PaLM-2 en la mayoría de los servicios de Google.

El enfoque de Microsoft hacia la IA va más allá del desarrollo de modelos. Como informó Decrypt recientemente, la introducción de chips personalizados, Maia y Cobalt, muestra que la empresa se está moviendo hacia la integración total de la IA y la computación en la nube. Los chips de computadora, optimizados para tareas de IA, respaldan la visión más amplia de Microsoft de armonizar las capacidades de hardware y software y compiten directamente contra Google Tensor y la nueva serie de chips M de Apple.

Es importante destacar que Phi-2 es un modelo de lenguaje tan pequeño que se puede ejecutar localmente en equipos de baja gama, incluso potencialmente en teléfonos inteligentes, lo que abre el camino a nuevas aplicaciones y casos de uso.

A medida que Phi-2 entra en el ámbito de la investigación y desarrollo de IA, su disponibilidad en el catálogo de modelos de Azure AI Studio también es un paso hacia la democratización de la investigación en IA. Además, Microsoft es una de las empresas más activas que contribuyen al desarrollo de IA de código abierto.

A medida que el panorama de la IA continúa evolucionando, Phi-2 de Microsoft es evidencia de que el mundo de la IA no siempre se trata de pensar en grande. A veces, el mayor poder radica en ser más pequeño pero más inteligente que la competencia.

Editado por Ryan Ozawa.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.

Noticias recomendados

Comparativa Detallada de Modelos de IA Que Ofrecen Una Experiencia de Conversación "Más Humana"
No todas las IA son creadas iguales, algunas pueden destacar en arte, otras son hábiles en programación, y otras tienen la capacidad de predecir estructuras de proteínas con precisión. Pero cuando buscas algo más fundamental —simplemente "alguien" con quien hablar— los mejores compañeros de IA pueden no ser los que lo saben todo, sino aquellos que tienen ese "no se qué" que te hacen sentir bien solo con hablar, similar a cómo tu mejor amigo podría no ser un genio pero de alguna manera siempre s...
ComentariosArtificial Intelligence
14 min lectura
Jose Antonio LanzMar 17, 2025
Create an account to save your articles.
Microsoft Integrará la IA Copilot en Xbox Para Ayudar a los Jugadores
Como alguien que juega Apex Legends religiosamente, la idea de un entrenador impulsado por inteligencia artificial es tentadora, especialmente cuando los servicios de entrenamiento pueden ser costosos. Si un chatbot gratuito puede ayudarme a acumular más victorias, estoy completamente a favor. Para mí y millones de otros jugadores en Xbox, una nueva función de Copilot promete elevar nuestro juego. Durante un episodio del Podcast Oficial de Xbox, la Vicepresidenta Corporativa de Juegos de IA de X...
NoticiasArtificial Intelligence
3 min lectura
Jason NelsonMar 16, 2025
Create an account to save your articles.
Expertos Desmienten Afirmaciones de Musk Sobre Origen Ucraniano Del Ataque DDoS a X
La afirmación de Elon Musk de que el ataque DDoS contra X (anteriormente Twitter) se originó en Ucrania generó escepticismo entre los expertos en ciberseguridad, quienes argumentan que atribuir ataques basándose en direcciones IP no es confiable. Los atacantes frecuentemente utilizan redes privadas virtuales (VPNs) y otros métodos para ocultar sus orígenes, lo que dificulta identificar una fuente geográfica específica. El lunes, X fue objetivo de un ataque distribuido de denegación de servicio q...
NoticiasTecnología
4 min lectura
Jason NelsonMar 14, 2025
Create an account to save your articles.

Coin Prices