Claude Mythos de Anthropic: ¿Amenaza Seria o Exagerada? Instituto de Seguridad de IA Da su Veredicto

Claude Mythos podría representar una amenaza masiva para la ciberseguridad, según pruebas tempranas del Instituto de Seguridad de IA del Reino Unido.

Por Decrypt Agent

3 min lectura

El Instituto de Seguridad de IA del Reino Unido evaluó la vista previa de Claude Mythos de Anthropic para medir sus supuestas capacidades en ciberseguridad, y encontró que el modelo de IA puede ejecutar de forma autónoma ataques cibernéticos sofisticados con tasas de éxito sin precedentes.

La existencia de Claude Mythos fue revelada por primera vez a finales de marzo a través de una filtración en un sitio web, con Anthropic confirmando que el potente modelo de próxima generación es capaz de encontrar y explotar vulnerabilidades de ciberseguridad a un nivel nunca antes visto por ningún modelo de IA disponible. Según se informó, encontró vulnerabilidades graves en navegadores web y sistemas operativos actuales.

En lugar de lanzar el modelo públicamente, Anthropic ha ofrecido acceso limitado a decenas de firmas de investigación en seguridad para probar el modelo y prepararse para sus capacidades avanzadas. La semana pasada, el secretario del Tesoro de EE. UU., Scott Bessent, y el presidente de la Reserva Federal, Jerome Powell, supuestamente advirtieron a ejecutivos bancarios sobre la inminente amenaza de seguridad que representa Claude Mythos.

Los resultados de las pruebas del Instituto de Seguridad de IA, publicados el lunes, muestran que detrás del revuelo hay fundamentos reales. La evaluación reveló que Mythos Preview tuvo éxito el 73% de las veces en tareas de captura de bandera de nivel experto, desafíos que ningún modelo de IA podía completar antes de abril de 2025, según indicó el instituto.

La amenaza podría ser considerable y de gran alcance, aunque la tecnología también podría usarse para detectar y corregir vulnerabilidades, en lugar de simplemente explotarlas. Para los operadores de infraestructura cripto, estas capacidades crecientes de la IA representan una nueva categoría de amenaza de seguridad potencial, a medida que los sistemas de IA ganan la capacidad de sondear y explotar vulnerabilidades de red de forma independiente.

Mythos Preview se convirtió en el primer modelo de IA en completar "The Last Ones" (TLO), señaló el Instituto de Seguridad de IA, una simulación de ataque a redes corporativas de 32 pasos que normalmente requiere 20 horas para que los humanos la finalicen. El modelo logró completarla en tres de cada 10 intentos, promediando 22 de los 32 pasos en todas las ejecuciones.

La simulación abarca desde el reconocimiento inicial hasta la toma de control total de la red, imitando intrusiones corporativas del mundo real. Claude Opus 4.6, el modelo con el segundo mejor rendimiento, promedió solo 16 pasos. El instituto del Reino Unido señaló que el rendimiento de Mythos Preview continúa escalando con mayores recursos computacionales, utilizando hasta 100 millones de tokens por ejecución de evaluación.

Cuando se le dirige explícitamente y se le otorga acceso a la red en evaluaciones controladas, el modelo demostró capacidades para ejecutar ataques en múltiples etapas y descubrir vulnerabilidades sin orientación humana.

El avance representa una escalada dramática respecto a hace apenas dos años, cuando los modelos de IA tenían dificultades con ejercicios básicos de ciberseguridad. El Instituto de Seguridad de IA del Reino Unido, que ha rastreado estas capacidades desde 2023, documentó esta rápida progresión desde tareas de nivel principiante hasta ataques autónomos de nivel experto.

Para el ecosistema cripto, donde las vulnerabilidades en contratos inteligentes y los hackeos a exchanges ya cuestan miles de millones anuales, los ataques impulsados por IA podrían amplificar los riesgos existentes. Los protocolos de DeFi, o finanzas descentralizadas, que suelen depender de sistemas complejos e interconectados, pueden enfrentar una exposición particular a intentos de explotación automatizada capaces de analizar y atacar múltiples vectores de forma simultánea.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados