En Resumen

  • EE.UU. ordenó a Anthropic suspender acceso a Claude Fable 5 y Mythos 5 para ciudadanos extranjeros por un posible jailbreak.
  • Anthropic acató la directiva, pero cuestionó su gravedad y advirtió que el estándar detendría todos los despliegues frontera.
  • David Sacks acusó a Dario Amodei de negarse a corregir el jailbreak, contradiciendo la imagen de seguridad de la empresa.

El gobierno de EE.UU. emitió el viernes una directiva de emergencia de control de exportaciones ordenando a Anthropic suspender de inmediato el acceso a sus dos modelos de inteligencia artificial más poderosos —Claude Fable 5 y Claude Mythos 5, ambos lanzados apenas días antes— para todos los ciudadanos extranjeros, incluidos los propios empleados de la empresa, citando razones de seguridad nacional.

La directiva prohíbe que cualquier ciudadano extranjero acceda a los modelos, ya sea dentro o fuera de Estados Unidos. El amplio alcance de la orden obligó a Anthropic a deshabilitar los modelos para toda su base de clientes con el fin de garantizar el cumplimiento.

La carta no proporcionó detalles específicos sobre su preocupación de seguridad nacional, pero el gobierno cree haber identificado un método para eludir, o "jailbreakear", el modelo Fable 5 disponible al público. Mythos 5, que cuenta con menos restricciones y es particularmente poderoso para detectar vulnerabilidades de ciberseguridad, solo estaba disponible para socios seleccionados.

Anthropic cuestionó la gravedad del hallazgo. La empresa afirmó que revisó una demostración de la técnica y concluyó que las vulnerabilidades identificadas parecen relativamente simples, y que otros modelos disponibles públicamente también son capaces de detectarlas sin necesidad de ningún bypass.

La empresa señaló que el gobierno ha proporcionado hasta ahora únicamente evidencia verbal de un posible jailbreak parcial y no universal —que consiste esencialmente en pedirle al modelo que lea una base de código específica y corrija cualquier falla de software. Anthropic agregó que validó que el nivel de capacidad demostrado ya está ampliamente disponible en modelos de la competencia, como GPT-5.5 de OpenAI.

Aunque acatando la directiva, Anthropic indicó que considera que la acción sienta un precedente peligroso. "Si este estándar se aplicara en toda la industria", escribió la empresa, "creemos que esencialmente detendría todos los nuevos despliegues de modelos para todos los proveedores de modelos frontera".

El acceso a todos los demás modelos de Anthropic no se verá afectado. La empresa dijo que trabaja para restablecer el acceso lo antes posible.

El sábado, David Sacks —copresidente del Consejo de Asesores en Ciencia y Tecnología del Presidente— escribió en X que "un socio de alta credibilidad y confianza tanto de Anthropic como del gobierno de EE.UU. que estaba probando Fable presentó un jailbreak de esas restricciones. La administración le pidió a [el CEO de Anthropic, Dario Amodei] que corrigiera el jailbreak o retirara el modelo. Dario se negó".

Sacks afirmó además que la reacción de Anthropic ante la solicitud del gobierno contradice los propios planteamientos públicos de la empresa sobre la necesidad de seguridad y regulación en la IA —una perspectiva que Amodei volvió a compartir esta semana en una entrada de blog.

"Anthropic priorizó el mantenimiento del modelo de consumo por encima de la seguridad", escribió Sacks. "Como reacción, la administración emitió el control de exportaciones. Lo hizo de manera reluctante. Le ha sorprendido mucho que Anthropic no haya querido cooperar con una solicitud de seguridad razonable (es decir, corregir el problema del jailbreak). La reacción de Anthropic es muy contraria a su imagen y filosofía como comunidad de investigación de IA segura".

Sacks agregó que la administración espera que Anthropic resuelva el problema y que Fable 5 pueda volver a estar disponible al público.

"La administración valora las capacidades técnicas de Anthropic y considera que este problema, aunque serio, debería resolverse fácilmente", escribió. "La pelota está en el campo de Anthropic".

A principios de este año, Anthropic y el gobierno de EE.UU. chocaron cuando la empresa de IA se negó a firmar un acuerdo ampliado que permitía la vigilancia doméstica masiva de ciudadanos estadounidenses y sistemas de armas letales completamente autónomos.

El presidente Donald Trump arremetió contra la empresa tras el fracaso de las negociaciones, y el Departamento de Defensa catalogó a Anthropic como un "riesgo en la cadena de suministro" —una designación que la firma ha impugnado ante los tribunales. Desde entonces, se han publicado reportes de que el enfrentamiento entre ambas partes se ha distendido a medida que el gobierno buscaba acceso a Claude Mythos y otros modelos.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.