En Resumen

  • Anthropic anunció que su modelo de IA, Claude 3.7 Sonnet, puede jugar y ganar en Pokémon, venciendo a Brock en horas y a Misty en días.
  • Claude 3.7 Sonnet utiliza capturas de pantalla, mantiene notas y realiza llamadas de función para navegar el juego con planificación estratégica.
  • El logro muestra cómo la IA puede aplicar razonamiento generalizado a tareas novedosas sin depender únicamente del entrenamiento previo.

Resulta que las cortadoras de césped robóticas y ChatGPT no son los únicos que pueden jugar videojuegos.

Anthropic dijo el martes que la última versión de Claude, 3.7 Sonnet, puede jugar al videojuego clásico Pokémon.

En un hilo publicado en X, Anthropic afirmó que una versión temprana de Claude 3.7 Sonnet podía derrotar a oponentes en cuestión de horas jugando Pokémon.

"Los resultados fueron sorprendentes. En cuestión de horas, Claude derrotó a Brock. Días después, aplastó a Misty. Un progreso que los modelos anteriores tenían pocas esperanzas de lograr", escribió Anthropic. "Resulta que el pensamiento extendido es súper efectivo".

Según Anthropic, Claude 3.7 Sonnet mantiene notas en su base de conocimiento, observa la pantalla y emplea llamadas de función para hacer clic en botones y navegar por el juego.

Además de capturas de pantalla, Anthropic enlazó a un canal de Twitch llamado "ClaudePlaysPokemon" que muestra a Claude jugando.

Lo que hizo posible derrotar a los oponentes de Pokémon, según Anthropic, fue la capacidad de Claude 3.7 Sonnet para planificar sus próximos movimientos y adaptar sus estrategias, mientras que modelos anteriores como Claude 3.5 Sonnet divagaban o se quedaban atrapados en un bucle.

"Con algunas herramientas para ayudarle a ver mejor la pantalla, Claude actúa como un agente, aplicando sus habilidades a una tarea novedosa", escribió Anthropic. "En esto, comenzamos a ver destellos de sistemas de IA que abordan desafíos con competencia creciente, no solo a través del entrenamiento, sino con razonamiento generalizado".

Claude 3.7 Sonnet es el más reciente modelo de IA en jugar videojuegos con éxito. En marzo pasado, investigadores utilizaron ChatGPT para jugar al clásico shooter en primera persona Doom, logrando llegar hasta la última sala del juego una vez.

Ese mismo mes, Google DeepMind lanzó su Agente Multimundo Escalable e Instruible (SIMA). Esta IA generalista, capaz de realizar diversas tareas como generación de texto, análisis de imágenes y traducción, fue entrenada para jugar videojuegos como No Man's Sky, Teardown y Valheim.

"Nuestro agente de IA no necesita acceso al código fuente de un juego, ni APIs específicas", escribió Google DeepMind. "Solo requiere dos entradas: las imágenes en pantalla e instrucciones simples en lenguaje natural proporcionadas por el usuario".

Editado por Sebastian Sinclair.

GG Newsletter

Get the latest web3 gaming news, hear directly from gaming studios and influencers covering the space, and receive power-ups from our partners.