En Resumen

  • Microsoft presentó siete modelos MAI en el Build 2026, liderados por MAI-Thinking-1, que superó al Claude Sonnet 4.6 en pruebas ciegas independientes.
  • MAI-Thinking-1 obtuvo 97% en AIME 2025 y superó a GPT-5.5 en calidad con un costo 10 veces menor, según Mustafa Suleyman.
  • Microsoft también lanzó modelos de código, imagen, transcripción en 43 idiomas y voz en 15 idiomas para diversificar su portafolio de IA.

En el primer día del evento anual Microsoft Build, el martes, el desarrollador de Windows presentó siete nuevos modelos de IA, afirmando que superaron al Claude Sonnet 4.6 de Anthropic y al Nano Banana 2 de Google en pruebas ciegas y benchmarks de edición de imágenes.

El anuncio llega en un momento en que Microsoft busca consolidarse como desarrollador de IA de frontera, y no únicamente como el mayor respaldo financiero e infraestructura de OpenAI.

"Muy emocionado de anunciar hoy siete nuevos modelos MAI de clase mundial", escribió en X el CEO de Microsoft AI, Mustafa Suleyman. "Representan lo que consideramos una nueva era en la IA, diseñada para mantenerte en control y en la vanguardia".

En el centro del lanzamiento se encuentra MAI-Thinking-1, un modelo de razonamiento que Microsoft describe como su modelo de texto fundamental insignia.

Según Suleyman, MAI-Thinking-1 fue preferido sobre el Claude Sonnet 4.6 de Anthropic en pruebas ciegas realizadas por evaluadores independientes. Agregó que el modelo obtuvo un 97% en AIME 2025, un benchmark que mide las habilidades avanzadas de resolución de problemas y razonamiento.

Suleyman señaló que el resultado en SWE Bench Pro ubica al modelo "justo al lado de Opus 4.6 en uno de los benchmarks de programación más exigentes".

La compañía también presentó MAI-Code-1-Flash, un modelo de programación liviano diseñado para GitHub Copilot y Visual Studio Code; MAI-Image-2.5 y su variante Flash, que según Microsoft superan al Nano Banana Pro de Google en tareas de edición de imágenes; MAI Transcribe-1.5, un modelo de transcripción que admite 43 idiomas; y MAI-Voice-2, un modelo de generación de voz capaz de producir voces de sonido natural en 15 idiomas y adaptarse a un hablante a partir de una breve muestra de audio.

"Este es un momento extraordinario en la tecnología. La capacidad de cómputo utilizada para entrenar modelos de frontera ha aumentado en un factor de un billón", afirmó Suleyman en una entrada de blog aparte donde anunció los nuevos modelos. "Ahora esperamos otro aumento de mil veces en los próximos tres años, lo que a su vez significa capacidades más avanzadas y el despliegue continuo de una IA cada vez más efectiva".

El anuncio se produce en un contexto donde la competencia entre los principales desarrolladores de IA continúa intensificándose.

La semana pasada, Anthropic anunció el lanzamiento de su más reciente modelo insignia, Opus 4.8, que según la compañía es más rápido e inteligente en pruebas de benchmark y viene con una serie de nuevas funciones. El martes, Anthropic anunció una expansión de su Project Glasswing, otorgando acceso a 150 empresas a su nuevo modelo Mythos, enfocado en ciberseguridad.

Mientras tanto, en el Google I/O de mayo, Google presentó Gemini Omni, un modelo de IA multimodal que combina Gemini con los modelos de generación de medios Veo, Nano Banana y Genie de la compañía, junto con Gemini Spark, un agente de IA basado en la nube diseñado para gestionar tareas en aplicaciones y flujos de trabajo en nombre del usuario.

El lanzamiento de los nuevos modelos de Microsoft sugiere un esfuerzo más amplio por desarrollar sistemas de IA propios, a medida que la empresa va más allá de su histórica dependencia en la tecnología de OpenAI, señalando que MAI "logró la mayor tasa de preferencia, superando a GPT-5.5 en calidad, con un costo 10 veces menor".

"Los desarrolladores y las empresas han estado pidiendo a gritos una IA que cumpla en sus términos y bajo su criterio", escribió Suleyman. "Vemos esto como un gran paso hacia lograrlo".

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.