En Resumen
A few researchers at Anthropic have, over the past year, had a part-time obsession with a peculiar problem.
Can Claude play Pokémon?
A thread: pic.twitter.com/K8SkNXCxYJ
— Anthropic (@AnthropicAI) February 25, 2025
$84,803.00
3.50%$1,654.86
6.30%$2.15
7.92%$598.36
2.46%$130.28
9.64%$0.999948
0.01%$0.166079
5.31%$0.24959
4.81%$0.658271
6.53%$1,652.64
6.32%$84,834.00
3.63%$9.38
-0.32%$13.18
5.80%$19.96
3.42%$0.246417
5.91%$2.30
6.14%$2.99
2.02%$0.174787
5.10%$0.00001254
4.42%$0.999963
0.00%$1,985.08
6.35%$334.33
9.46%$6.34
-1.00%$78.88
4.18%$3.73
6.29%$4.42
3.00%$15.65
5.06%$0.762878
26.79%$0.998514
0.04%$0.998318
-0.06%$1,655.44
6.24%$27.80
-0.44%$208.58
3.88%$1,760.14
6.22%$5.53
6.82%$53.49
1.02%$84,728.00
3.61%$0.00000719
4.95%$4.94
3.59%$0.91409
3.81%$22.75
2.66%$32.91
4.90%$2.19
6.62%$5.23
5.47%$0.090887
6.15%$1.047
-0.01%$1.00
0.00%$0.715252
3.43%$15.62
4.10%$259.93
7.46%$147.30
9.57%$1.16
0.03%$3.91
5.84%$0.02326413
7.17%$0.075405
0.49%$4.31
1.49%$0.324873
3.62%$84,381.00
3.10%$0.997142
-0.10%$4.05
0.04%$8.50
6.61%$0.527494
12.39%$0.192531
6.42%$0.190735
3.96%$2.54
5.05%$2.64
5.95%$0.308609
5.46%$3.79
5.01%$84,273.00
3.31%$10.51
0.75%$0.484485
10.79%$0.075981
10.86%$1,410.85
6.07%$0.407115
8.05%$0.690087
5.28%$136.17
9.15%$1.054
3.08%$4.04
0.85%$0.00001339
15.46%$0.998682
-0.01%$0.668277
8.26%$1,652.22
6.37%$0.01558693
4.34%$0.650882
6.31%$0.782717
9.36%$67.21
3.49%$1,717.11
6.27%$0.905006
2.61%$0.175147
14.60%$14.96
0.42%$0.999741
0.04%$0.344501
3.26%$0.999716
-0.06%$8.48
4.92%$0.622655
2.09%$0.999628
0.04%$1,862.98
6.21%$3,239.98
-0.55%$0.082494
5.10%$0.436524
6.22%$0.01592712
26.52%$0.754673
2.96%$83,947.00
3.53%$597.58
2.41%$3,241.85
-0.60%$0.99824
0.04%$84,600.00
3.59%$0.760317
5.00%$0.01512966
6.08%$0.27041
4.56%$0.01966917
-18.29%$1,760.00
6.42%$0.998832
0.00%$0.501504
8.54%$0.167773
5.24%$0.00000063
5.01%$143.11
9.62%$0.104863
3.18%$2.04
1.93%$166.94
9.62%$2.00
15.32%$29.28
4.49%$0.364773
5.58%$1.82
5.87%$0.551175
2.10%$3.15
8.67%$35.41
-4.25%$0.00005777
6.70%$0.541314
-0.01%$3.35
3.52%$0.582107
17.44%$0.999635
-0.01%$1,723.39
6.31%$14.95
6.12%$0.996272
-0.04%$0.136588
7.07%$0.263428
8.21%$0.069911
0.40%$83,439.00
8.91%$1.71
8.08%$0.432168
4.45%$0.999924
0.00%$0.00506743
7.49%$0.999973
0.01%$4.21
4.04%$0.00792283
7.15%$0.579611
4.21%$1.11
0.67%$0.437804
13.29%$84,524.00
3.06%$0.165463
4.81%$85,066.00
3.40%$0.00000043
4.26%$14.57
2.68%$1.17
4.98%$1.002
0.24%$1.08
0.01%$0.00002015
5.84%$1,761.57
6.56%$110.66
0.02%$5.55
3.73%$0.135033
2.44%$84,747.00
3.84%$0.04025522
2.33%$2.39
0.42%$0.999219
-0.04%$1.81
-5.23%$0.073736
4.74%$0.578533
9.78%$41.77
3.94%$0.999049
-0.10%$0.460805
25.17%$22.49
-0.15%$5.59
4.31%$0.00576744
30.30%$0.15704
65.82%$1,648.60
6.02%$77,106.00
0.00%$0.077644
5.87%$0.43939
5.10%$1,651.86
6.25%$0.99764
-0.30%$0.557006
1.19%$0.00652546
-0.12%$1,727.72
6.39%$1,651.31
6.17%$0.127701
-11.11%$0.190451
3.70%$0.797165
2.57%$4.13
2.27%$0.164154
2.66%$0.00006028
3.32%$1.001
0.18%$0.999965
0.05%$0.00000157
-4.34%$0.00376894
1.78%$1,653.36
6.19%$0.324699
4.39%$0.03082146
20.07%$0.0305049
2.86%$1,668.30
4.70%$0.999858
0.09%$0.257863
18.91%$2.67
7.15%$0.999769
-0.06%$0.142676
0.30%$0.698765
2.17%$1.16
11.35%$108.38
5.99%$0.223286
6.67%$3,235.39
0.19%$84,576.00
3.36%$0.597872
7.19%$85,168.00
3.87%$0.467212
4.67%$0.269654
24.49%$1,631.46
5.82%$2.73
-0.25%$0.25637
7.47%$21.14
3.89%$0.571264
18.68%$0.02974071
1.26%$1.057
6.89%$1,652.95
6.04%$0.499134
3.15%$0.177908
4.56%$0.99998
0.06%$21.98
3.82%$0.00040057
-3.87%$0.03396113
3.01%$1,745.38
6.04%$0.101085
6.92%$19.91
3.07%$1,699.55
3.37%$0.00257492
7.77%$0.672588
5.35%$13.93
5.50%$0.01139655
4.94%$1,808.09
6.05%$2.86
10.39%$13.40
5.94%$0.998321
0.08%$1,794.02
6.16%$3.33
6.26%$84,855.00
3.23%$0.251811
7.98%$0.00284352
8.65%$0.999552
-0.00%Leyendo
Resulta que las cortadoras de césped robóticas y ChatGPT no son los únicos que pueden jugar videojuegos.
Anthropic dijo el martes que la última versión de Claude, 3.7 Sonnet, puede jugar al videojuego clásico Pokémon.
En un hilo publicado en X, Anthropic afirmó que una versión temprana de Claude 3.7 Sonnet podía derrotar a oponentes en cuestión de horas jugando Pokémon.
"Los resultados fueron sorprendentes. En cuestión de horas, Claude derrotó a Brock. Días después, aplastó a Misty. Un progreso que los modelos anteriores tenían pocas esperanzas de lograr", escribió Anthropic. "Resulta que el pensamiento extendido es súper efectivo".
Según Anthropic, Claude 3.7 Sonnet mantiene notas en su base de conocimiento, observa la pantalla y emplea llamadas de función para hacer clic en botones y navegar por el juego.
A few researchers at Anthropic have, over the past year, had a part-time obsession with a peculiar problem.
Can Claude play Pokémon?
A thread: pic.twitter.com/K8SkNXCxYJ
— Anthropic (@AnthropicAI) February 25, 2025
Además de capturas de pantalla, Anthropic enlazó a un canal de Twitch llamado "ClaudePlaysPokemon" que muestra a Claude jugando.
Lo que hizo posible derrotar a los oponentes de Pokémon, según Anthropic, fue la capacidad de Claude 3.7 Sonnet para planificar sus próximos movimientos y adaptar sus estrategias, mientras que modelos anteriores como Claude 3.5 Sonnet divagaban o se quedaban atrapados en un bucle.
"Con algunas herramientas para ayudarle a ver mejor la pantalla, Claude actúa como un agente, aplicando sus habilidades a una tarea novedosa", escribió Anthropic. "En esto, comenzamos a ver destellos de sistemas de IA que abordan desafíos con competencia creciente, no solo a través del entrenamiento, sino con razonamiento generalizado".
Los usuarios de Reddit lo comentaron primero—Claude de repente se había vuelto más preciso y más capaz. Ahora sabemos por qué: Anthropic ha implementado mejoras significativas en sus modelos de IA, incluida una versión mejorada de Claude 3.5 Sonnet y una actualización muy necesaria de su modelo Haiku ligero. La actualización más inquietante de todas: Estas IA ahora pueden controlar físicamente las computadoras, moviendo cursores, desplazándose por páginas e incluso haciendo clic en botones como...
Claude 3.7 Sonnet es el más reciente modelo de IA en jugar videojuegos con éxito. En marzo pasado, investigadores utilizaron ChatGPT para jugar al clásico shooter en primera persona Doom, logrando llegar hasta la última sala del juego una vez.
Ese mismo mes, Google DeepMind lanzó su Agente Multimundo Escalable e Instruible (SIMA). Esta IA generalista, capaz de realizar diversas tareas como generación de texto, análisis de imágenes y traducción, fue entrenada para jugar videojuegos como No Man's Sky, Teardown y Valheim.
"Nuestro agente de IA no necesita acceso al código fuente de un juego, ni APIs específicas", escribió Google DeepMind. "Solo requiere dos entradas: las imágenes en pantalla e instrucciones simples en lenguaje natural proporcionadas por el usuario".
Editado por Sebastian Sinclair.
OpenAI acaba de presentar una importante actualización de las capacidades de memoria de ChatGPT, permitiendo que la IA haga referencia a todo el historial de conversaciones de un usuario para ofrecer respuestas más personalizadas. Esta función, que se lanza primero para los clientes de pago del nivel Pro de OpenAI, marca un paso hacia sistemas de IA más personalizados. "¡Hemos mejorado enormemente la memoria en ChatGPT—ahora puede hacer referencia a todas tus conversaciones pasadas!", anunció el...
SpaceX planea lanzar su masivo cohete Starship a Marte a finales de 2026, transportando el robot humanoide Optimus de Tesla, dijo el CEO Elon Musk el jueves, reafirmando declaraciones previas que compartió el mes pasado. La misión no tripulada tiene como objetivo probar la fiabilidad del aterrizaje antes de que los posibles vuelos humanos comiencen tan pronto como en 2029. Starship will hopefully depart for Mars at the end of next year with Optimus explorer robots! https://t.co/8dzlxzFg0h — Elo...
OpenAI afirma que Elon Musk no solo abandonó la empresa; intentó apoderarse de ella, y el gigante de investigación de IA dice que tiene los correos electrónicos para probarlo. En una contrademanda recién presentada, OpenAI acusa al CEO de Tesla, Elon Musk, de intentar una adquisición hostil de la empresa que ayudó a fundar, utilizando lo que llamó "tácticas de mala fe" y una "narrativa egoísta". OpenAI busca bloquear la supuesta campaña de acoso y disrupción de Elon Musk, centrada en una falsa o...