En Resumen
- Anthropic lanzaría esta semana Claude Opus 4.7 y una herramienta de diseño web con IA, afectando acciones de Adobe, Wix y Figma.
- Claude Mythos, modelo secreto de Anthropic, fue el primero en completar una simulación de ciberataque de 32 pasos en 3 de 10 intentos.
- La herramienta de diseño competirá con Gamma y Google Stitch, apuntando a usuarios técnicos y no técnicos simultáneamente.
Anthropic se prepara para lanzar Claude Opus 4.7 junto a una nueva herramienta de diseño impulsada por IA que permite a los usuarios crear sitios web, presentaciones y páginas de destino con prompts en lenguaje natural —noticias que provocaron una caída en las acciones de Adobe, Wix y Figma el lunes, según The Information.
Los productos podrían lanzarse tan pronto como esta semana, según indicó a The Information una persona con conocimiento de los planes. La herramienta de diseño apunta tanto a desarrolladores como a usuarios no técnicos, lo que la pone en una ruta de colisión con startups como Gamma y Stitch de Google.
Anthropic no respondió a la solicitud de comentarios de Decrypt.
Opus 4.7 ni siquiera es el modelo más poderoso de Anthropic. Ese título le pertenece a Claude Mythos —una bestia enfocada en ciberseguridad que la empresa está entregando discretamente a firmas de seguridad seleccionadas, manteniéndolo fuera del alcance del público.
El Instituto de Seguridad de IA del Reino Unido evaluó recientemente Mythos Preview y determinó que puede ejecutar de forma autónoma sofisticados ciberataques a tasas que ningún otro modelo ha igualado. Se convirtió en el primer sistema de IA en completar "The Last Ones", una simulación de ataque a redes corporativas de 32 pasos que normalmente le toma a equipos de red team humanos 20 horas. Mythos lo logró en tres de diez intentos, completando en promedio 22 de los 32 pasos, frente a los 16 de Opus 4.6.
Esto importa más allá de la seguridad empresarial. Medir lo que la IA puede hacer realmente se ha convertido en un dolor de cabeza generalizado en la industria. OpenAI calificó recientemente el benchmark líder en programación como "contaminado", aunque los modelos siguen siendo comparados usando esas mismas pruebas. Una evaluación independiente de ARC-AGI-3 vio a Gemini obtener un 0,37% y a GPT-5.4 alcanzar un 0,26%, mientras los humanos lograron el 100%. El resultado es un panorama donde los benchmarks son al mismo tiempo cuestionados y utilizados como evidencia, lo que dificulta contextualizar las afirmaciones sobre los avances de Opus 4.7 hasta que Anthropic publique una ficha técnica detallada del modelo.
La relación entre Opus y Mythos es más estrecha de lo que la mayoría imagina. Anthropic construye sus modelos de frontera mediante fine-tuning sobre la línea Opus —la misma base que impulsa los productos públicos de Claude se somete a pruebas de estrés hasta convertirse en Mythos. Opus 4.7 es el fundamento que eventualmente recibe el entrenamiento en ciberseguridad.
Además, los esfuerzos de Anthropic se han orientado cada vez más hacia los casos de uso de desarrollo y empresas. La filtración del código de Claude, el lanzamiento del sistema de skills y el protocolo MCP, el enfoque en la IA agéntica y la atención a los benchmarks de programación lo hacen aún más evidente. Aunque Anthropic no lo ha anunciado formalmente, las filtraciones refuerzan el giro más amplio de proveedor de LLM hacia algo que se asemeja a un modelo de "estudio de IA" de stack completo, donde Claude no solo genera texto, sino que construye y despliega productos completos.

