En Resumen

  • Anthropic presentó Claude Sonnet 5 el martes como su modelo Sonnet más agéntico, con rendimiento cercano a Opus 4.8 a precios más bajos.
  • El modelo incorpora un tokenizador actualizado que consume entre 1,0 y 1,35 veces más tokens, con tarifa introductoria de $2/$10 hasta el 31 de agosto.
  • Sonnet 5 obtuvo 63,2% en SWE-bench Pro frente al 58,1% de Sonnet 4.6, y un empate estadístico con Opus 4.8 en Humanity's Last Exam.

Anthropic lanzó Claude Sonnet 5 el martes, llamándolo "el modelo Sonnet más agéntico hasta la fecha". Es el modelo predeterminado para usuarios Free y Pro, disponible en los planes Max, Team y Enterprise, en Claude Code y a través de la API. A diferencia de lanzamientos anteriores de Sonnet, este fue diseñado para posicionarse junto al Opus anterior en lugar de quedar un nivel por debajo.

En su publicación de lanzamiento, la empresa afirma que el rendimiento de Sonnet 5 está "cerca del de Opus 4.8, pero a precios más bajos". Los desarrolladores pueden ajustar un dial de esfuerzo entre los dos modelos o elegir diferentes niveles en la aplicación web para equilibrar costo y precisión en la misma tarea, cubriendo terreno que antes requería las tarifas de Opus.

En SWE-bench Pro —un benchmark de programación que extrae problemas de repositorios activamente mantenidos con cambios en múltiples archivos, puntuado como porcentaje resuelto— Sonnet 5 alcanzó un 63,2% frente al 58,1% de Sonnet 4.6.

En GDPval-AA v2, un benchmark de Artificial Analysis que evalúa tareas profesionales del mundo real en 44 empleos mediante calificaciones Elo pareadas a ciegas, obtuvo 1.618, un empate estadístico con los 1.616 de Opus 4.8. Las diferencias entre Sonnet 5 y Opus 4.8 en Humanity's Last Exam son básicamente insignificantes: 57,4% frente a 57,9%.

Sonnet 5 también incluye un tokenizador actualizado —el sistema que divide el texto en las unidades por las que un modelo cobra— y es más demandante, convirtiendo la misma entrada en una tarea que consume más tokens. "Sonnet 5 es una mejora respecto a Sonnet 4.6, pero utiliza un tokenizador actualizado que cambia la forma en que el modelo procesa el texto para mejorar el rendimiento", señaló Anthropic en una pequeña nota al pie. "La compensación es que la misma entrada puede mapearse a más tokens: aproximadamente 1,0–1,35× dependiendo del tipo de contenido".

Anthropic estableció la tarifa introductoria de $2/$10 para que esa transición sea prácticamente neutral en costos hasta el 31 de agosto, después de lo cual el precio volverá al estándar de $3/$15 que Sonnet ha cobrado.

Parte del entusiasmo por este lanzamiento ya estaba preparado. Los desarrolladores pasaron semanas esta primavera discutiendo cómo Anthropic dejó que Opus 4.6 perdiera silenciosamente su ventaja —denominada reduflación de IA (en español), citando capacidades degradadas— y Anthropic negó haber degradado intencionalmente cualquier modelo. Parte del mismo debate extendió esa sospecha a Sonnet, argumentando que el patrón se repite: dejar que el modelo antiguo se estanque, para que el nuevo parezca un salto mayor en comparación.

Sonnet 5 también llega sin el equipaje asociado al nivel superior de Anthropic. Fable 5 y Mythos 5 permanecen suspendidos para ciudadanos extranjeros desde el 12 de junio bajo una directiva de control de exportaciones de EE.UU. (en español) vinculada a un hallazgo de jailbreak en disputa. Sonnet 5 nunca fue entrenado en tareas de ciberseguridad y obtuvo un 0% en el desarrollo de un exploit funcional para Firefox, por lo que se lanza con medidas de seguridad más ligeras que el bloqueo de Fable.

La system card de Anthropic describe un modelo diseñado para ofrecer inteligencia cercana a Opus a precios de Sonnet para programación, agentes y trabajo cotidiano. También señala algo curioso: "Es el primer modelo en criticar la regla de su Constitución que establece que debe seguir restricciones estrictas incluso cuando considera que esas restricciones son poco éticas", escribió el equipo de investigación. Anthropic afirma que no está seguro de lo que eso significa para el modelo, solo que vale la pena observarlo.

No vamos a decir que así comenzó Skynet, pero así es como comenzó Skynet.

Hicimos una prueba rápida

Le lanzamos a Sonnet 5 un prompt zero-shot para construir un pequeño juego de navegador, la misma prueba que realizamos con Sonnet 4.5 (en español) el año pasado.

Nuestro juego de mecanografía funcionó en el primer intento, con visuales más limpios y una lógica más ajustada que lo que Sonnet 4.6 produjo con el mismo prompt.

Sin embargo, tomó demasiado tiempo en comparación con otros modelos (aproximadamente 30 minutos de razonamiento) y consume tokens de forma desmedida. Esa única iteración consumió el 90% de nuestro límite de 5 usos en el plan Claude Pro.

Puedes probar el juego final en nuestro sitio de itch.io.

En una tarea de programación más compleja de múltiples pasos, Sonnet 5 se ubicó cerca de Opus 4.8 dependiendo del nivel de esfuerzo, y el mismo prompt ejecutado en múltiples intentos costó notablemente menos que el trabajo equivalente en Opus o Fable.

El número de versión de Sonnet 5 también tiene un peso real. Cada salto de número entero en la historia de Claude marcó una nueva generación: la versión 1 en marzo de 2023, la versión 2 cuatro meses después, la versión 3 ocho meses después de eso, y la versión 4 llegando 14 meses más tarde en mayo de 2025. Sonnet 5 llega 13 meses después con una brecha similar en términos de tiempo, probablemente una señal de lo intensa que es la competencia, especialmente ahora que los modelos chinos están cerrando la brecha (en español) tan rápidamente.

Dicho esto, la brecha generacional no se sentirá tan impresionante como el salto de Claude 3 a Claude 4, por ejemplo. También es una señal de la prisa con la que las grandes empresas de IA lanzan nuevos modelos, sin importar cuán grande sea la mejora.

Si Anthropic sigue el orden que usó en el ciclo anterior, Sonnet generalmente lidera, luego lanza su Haiku económico y pequeño, con Opus, su versión de última generación, lanzada después. La brecha más corta entre tres modelos con versiones similares ha sido de un mes por lanzamiento: Sonnet 4.5 se lanzó en septiembre de 2025, Haiku 4.5 siguió en octubre, y Opus 4.5 cerró esa generación en noviembre.

Siguiendo esa cadencia optimista, Haiku 5 y Opus 5 son los dos modelos que aún faltan, potencialmente para ser lanzados este año. Dicho esto, Anthropic no ha sido consistente con los lanzamientos. La brecha entre Haiku 4.5 y Sonnet 4.6 fue de más de 3 meses, así que crucen los dedos si quieren probar Opus 5 pronto.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.