En Resumen

  • OpenAI lanzó GPT-5.5-Cyber con 85,6% en CyberGym, superando al Mythos 5 de Anthropic que obtuvo 83,8%.
  • Mythos 5 y Fable 5 de Anthropic siguen fuera de línea tras una directiva de emergencia por seguridad nacional.
  • OpenAI firmó alianzas de ciberdefensa con siete países y 28 firmas de seguridad como CrowdStrike y Cisco.

El modelo de ciberseguridad de OpenAI acaba de superar al modelo de IA Mythos de Anthropic que el gobierno de Estados Unidos sacó de línea—y sigue activo y funcionando.

El 22 de junio, OpenAI anunció el lanzamiento completo de GPT-5.5-Cyber como parte de su programa de ciberdefensa Daybreak. En CyberGym—un benchmark desarrollado en UC Berkeley que presenta a agentes de IA 1.507 vulnerabilidades de software conocidas de 188 proyectos de código abierto y los evalúa según cuántas pueden reproducir en un entorno controlado—el modelo actualizado alcanzó un 85,6%.

Mythos 5 de Anthropic se ubica en un 83,8% en la misma tabla de clasificación. Claude Opus 4.7, el modelo de disponibilidad más amplia de Anthropic, obtuvo un 73,1%.

Una diferencia de menos de dos puntos en cualquier benchmark normalmente no sería destacable. Sin embargo, el contexto aquí es diferente. El Mythos 5 y el Fable 5 de Anthropic fueron retirados de línea el 12 de junio después de que la administración de Donald Trump emitiera una directiva de emergencia de control de exportaciones citando seguridad nacional.

El gobierno señaló un jailbreak—una técnica para evadir los límites de seguridad integrados de un modelo de IA, similar a encontrar una llave maestra que abre una puerta de alta seguridad. Anthropic no tenía una forma confiable de verificar la nacionalidad de los usuarios a gran escala, por lo que deshabilitó ambos modelos para todos, en todas partes.

Parte del daño fue autoinfligido. Anthropic pasó meses describiendo a Mythos como uno de los modelos de IA más capaces—y más peligrosos—jamás construidos, advirtiendo en su propia documentación de lanzamiento que sus capacidades de ciberseguridad podrían causar daños graves sin las restricciones adecuadas. El CEO de Anthropic, Dario Amodei, publicó un ensayo el 10 de junio comparando los modelos de IA de frontera con aeronaves que los reguladores de seguridad deberían poder dejar en tierra si no pasan las auditorías.

Pocos días después, el gobierno dejó en tierra la aeronave de Anthropic.

No fue la única alarma esa semana. Anthropic ya había sido criticada por un filtro oculto en Fable 5 que degradaba silenciosamente las respuestas del modelo para usuarios que sospechaba estaban construyendo IA competidora—sin informarles—y fue obligada a disculparse y revertir la política.

Un enfoque diferente

Mientras Anthropic negocia con el Departamento de Comercio y continúa su demanda contra la administración Trump, OpenAI está ampliando su alcance. Daybreak ha firmado alianzas de ciberseguridad con Australia, Canadá, Francia, Alemania, Japón, Corea del Sur e instituciones de la UE, entre ellas la Agencia de Ciberseguridad de la Unión Europea.

Veintiocho firmas de seguridad—entre ellas CrowdStrike, Cisco y Cloudflare—se han unido a su Programa de Socios Cibernéticos para integrar GPT-5.5 en sus productos para clientes verificados. Según el propio blog de OpenAI, la herramienta Codex Security ha escaneado más de 30 millones de commits en 30.000 bases de código y ha registrado más de 500.000 vulnerabilidades corregidas desde su lanzamiento en marzo.

La empresa también está expandiendo un programa de socios para que las firmas de seguridad puedan integrar estas capacidades en sus propias herramientas, y lanzó "Patch the Planet", una iniciativa para ayudar a corregir vulnerabilidades en proyectos de código abierto de uso extendido.

Dicho esto, GPT-5.5-Cyber no está disponible para uso general. Solo está disponible para profesionales de seguridad verificados, y OpenAI realizó pruebas previas al despliegue con agencias federales—entre ellas el Centro de Estándares e Innovación en IA y la Oficina del Director Nacional de Ciberseguridad—antes del lanzamiento. Se trata del mismo enfoque de acceso restringido que Anthropic intentó con Mythos, pero OpenAI obtuvo la aprobación del gobierno primero.

Desde el 23 de junio, Fable 5 y Mythos 5 siguen fuera de línea—once días después de una suspensión sin fecha oficial de restauración por parte de Anthropic ni del Departamento de Comercio.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.