En Resumen

  • Sam Altman anunció que OpenAI lanzará dos modelos intermedios, o3 y o4-mini, antes de GPT-5, en “unas semanas”.
  • El cambio busca ganar tiempo y capacidad computacional para un GPT-5 más potente, tras dificultades técnicas de integración.
  • GPT-5 será un modelo completamente multimodal, unificando lenguaje, razonamiento e imagen en un solo sistema.

Sam Altman, CEO de OpenAI, reveló el viernes un cambio significativo en los planes de lanzamiento de la compañía, anunciando que dos modelos intermedios llegarán antes del muy anticipado GPT-5.

"Cambio de planes: Vamos a lanzar o3 y o4-mini después de todo, probablemente en un par de semanas, y luego GPT-5 en unos meses", escribió Altman en X el viernes.

El sorpresivo anuncio llega mientras OpenAI lidia con complejidades técnicas en el desarrollo de su modelo insignia. Altman admitió que la compañía "encontró más difícil de lo que pensaba integrar todo suavemente" en GPT-5, sugiriendo que el lanzamiento escalonado ayudará a asegurar suficiente capacidad "para soportar lo que esperamos sea una demanda sin precedentes".

Esta movida coloca a OpenAI en un campo cada vez más concurrido de pesos pesados de la IA que están lanzando modelos avanzados. Google recientemente lanzó Gemini 2.5 Pro, que cuenta con 1 millón de tokens de contexto y ha sido ampliamente considerado como el mejor modelo de razonamiento y codificación disponible—y es gratuito.

Mientras tanto, DeepSeek R2, Grok-3 y Claude 3.7 Sonnet con capacidades de pensamiento extendido están todos programados para un lanzamiento inminente—cada uno reduciendo el precio del modelo de razonamiento de OpenAI.

Los mejores modelos de razonamiento disponibles. Imagen: Artificial Analysis

Altman insinuó un lado positivo: lanzar los modelos intermedios le dará a OpenAI más tiempo para potenciar GPT-5.

"La razón más emocionante es que vamos a poder hacer GPT-5 mucho mejor de lo que originalmente pensamos", escribió. Se espera que GPT-5 sea completamente multimodal, fusionando todos los modelos especializados de OpenAI en un solo sistema. Eso eliminaría la necesidad actual de que ChatGPT cambie entre modelos de razonamiento, modelos de lenguaje estándar y modelos de generación de imágenes según el prompt. En su lugar, todas estas funciones serían manejadas por un modelo unificado.

Las especificaciones técnicas para o3 y o4-Mini permanecen bajo reserva, pero se espera que cubran la brecha de capacidades entre GPT-4 y el próximo GPT-5, que los observadores de la industria creen que presentará mejoras sustanciales en funciones de razonamiento, planificación y memoria.

El último lanzamiento de OpenAI, el o1 Pro enfocado en razonamiento, llegó con precios sorprendentes: $150 por millón de tokens (~750.000 palabras) para entrada y $600 por millón de tokens generados. Eso es el doble del costo de entrada de GPT-4.5 y 10 veces el precio del o1 regular. Y como referencia, DeepSeek R1 cuesta menos de $1 por millón de tokens.

La hoja de ruta revisada llega apenas días después de que OpenAI cerrara una histórica ronda de financiación de $40.000 millones—el mayor evento de recaudación de fondos por parte de cualquier empresa tecnológica privada.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.