En Resumen
- Anthropic desplegó seis ingenieros en la NSA para adaptar Mythos a operaciones cibernéticas ofensivas contra China e Irán.
- Claude ya redacta más del 80% del código de producción de Anthropic, con ingenieros publicando ocho veces más por día.
- Anthropic propuso una pausa global verificable en IA, aunque reconoció que detenerse unilateralmente cede ventaja a rivales.
Anthropic ha ubicado a aproximadamente seis ingenieros dentro de la Agencia de Seguridad Nacional (NSA) para ayudar a desplegar Mythos —su modelo de IA más avanzado— en operaciones cibernéticas ofensivas, según reportó el jueves el Financial Times.
Los ingenieros son personal desplegado en campo, encargado de personalizar el modelo para aplicaciones específicas. Una fuente le dijo al FT que podría ser útil para infiltrarse en redes de países como China e Irán.
No está confirmado si esos ingenieros participan en operaciones activas. Lo que sí está claro es que Mythos es el mismo modelo que Anthropic se ha negado a lanzar públicamente, citando riesgos de uso indebido. La empresa lo ha limitado a socios verificados a través del Proyecto Glasswing —una coalición restringida que incluye a Microsoft, Apple y Amazon.
Anthropic también está demandando al Pentágono. A finales de febrero, el Secretario de Defensa Pete Hegseth designó a la empresa como un riesgo para la cadena de suministro —una etiqueta históricamente reservada para adversarios extranjeros como Huawei— tras el colapso de un contrato de $200 millones. El punto de fricción: Anthropic se negó a permitir que el Departamento de Defensa usara Claude para armas completamente autónomas o vigilancia masiva doméstica. El contrato con la NSA quedó exento de esa prohibición.
Un juez de California bloqueó la inclusión en la lista negra por considerarla una aparente represalia en virtud de la Primera Enmienda. Un tribunal de apelaciones de Washington D.C. negó la solicitud de Anthropic para suspenderla mientras se desarrolla el litigio. Sin embargo, la NSA continuó usando Mythos durante todo ese tiempo, según el reportaje del FT.
Cómo detener a una IA que construye IA
El mismo día en que se conoció la historia de la NSA, el instituto de investigación interno de Anthropic publicó "When AI Builds Itself", un análisis sobre hasta dónde ha llegado Claude en la automatización de su propio desarrollo. En él, la empresa aboga esencialmente por una moratoria global en la carrera armamentista de la IA, e incluso lo comparó con los tratados nucleares de la Guerra Fría firmados entre Estados Unidos y Rusia.
Para entender el porqué, la empresa ofreció este contexto:
Claude ahora escribe más del 80% del código que se integra al código de producción de Anthropic —frente a un porcentaje bajo de un solo dígito antes de que Claude Code se lanzara a principios de 2025. Los ingenieros publican aproximadamente ocho veces más código por día que en 2024.

Los autores del informe —Marina Favaro, directora del Instituto Anthropic, y el cofundador Jack Clark— argumentan que esta trayectoria se dirige hacia lo que denominan automejora recursiva: sistemas de IA que diseñan, construyen y entrenan de forma autónoma a sus propios sucesores, con un papel cada vez más reducido de los humanos en cada etapa.
En una representación visual, los investigadores muestran una línea de tiempo en la que la primera forma de usar la IA en el trabajo consiste en humanos que le hacen prompts al computador para obtener un resultado, con automatizaciones crecientes que culminan en agentes de IA haciendo prompts a subagentes hasta alcanzar el resultado, sin intervención humana.

El dato más revelador que citan: en abril, agentes de Claude recibieron un problema abierto de seguridad en IA —si un modelo más débil puede supervisar de manera confiable a uno más fuerte— y se les dejó trabajar de forma autónoma. Dos investigadores humanos, en aproximadamente una semana, recuperaron el 23% de la brecha de rendimiento entre los modelos. Los agentes recuperaron el 97%, en más de 800 horas acumuladas de cómputo. Los humanos plantearon la pregunta. Los agentes diseñaron cada experimento. Es el primer caso publicado en el que Claude ejerció criterio investigativo, no solo ejecutó tareas especificadas por otros.
Esa es la línea que Anthropic teme cruzar. Una vez que la IA elige qué experimentos vale la pena ejecutar —y no solo los ejecuta—, los humanos pierden el último rol significativo en el ciclo de desarrollo. Las pequeñas desalineaciones visibles en los modelos actuales podrían multiplicarse a través de generaciones que se automejoran, hasta que nadie pueda corregirlas.
Su solución propuesta es una pausa global verificable: varios laboratorios de frontera deteniéndose simultáneamente, con verificación independiente de que todos realmente se detuvieron. Anthropic afirmó que se uniría a una. Sin embargo, una desaceleración unilateral, reconocen, simplemente le cede la delantera a quien siguió adelante.
Ya hemos visto esta película antes. Los laboratorios que construyen IA son los mismos que advierten sobre su peligrosidad. Sin embargo, la IA es el negocio más rentable de la década, por lo que nadie quiere detenerse —ni siquiera quienes la advierten.
Desde 2023, más de cien grandes figuras de la comunidad investigadora de IA firmaron una carta abierta pidiendo un esfuerzo global para mitigar el riesgo de extinción que conlleva intrínsecamente el desarrollo de la IA. Unos meses antes, otra carta abierta le exigió a OpenAI pausar los avances en ChatGPT debido a su naturaleza peligrosa.
Nadie se detuvo tras la carta abierta de 2023. OpenAI no lo hizo. Anthropic tampoco. La fecha límite del Pentágono para retirar Claude de sus sistemas cae en agosto, alrededor del mismo momento en que se espera que la IPO de Anthropic lleve sus finanzas al escrutinio público.

