¡Cuidado Jugadores! Esta IA Desafía la Habilidad Humana en Batallas de Pokémon

Construido por investigadores del Instituto de Tecnología de Georgia, POKE ́LLMON es un agente de IA que utiliza un aprendizaje similar al humano y estrategias adaptables para convertirse en un jugador maestro de Pokémon.

Por Jose Antonio Lanz

4 min lectura

¿Quieres atraparlos a todos? Hay una IA para eso. Te presentamos POKE´LLMON, un nuevo agente de IA basado en LLM diseñado para jugar batallas de Pokémon con una habilidad similar a la de los humanos.

POKE´LLMON es el resultado del trabajo de investigadores del Instituto de Tecnología de Georgia, quienes afirman que utiliza aprendizaje por refuerzo en contexto y generación con conocimiento aumentado para aprender de sus experiencias de juego y tomar decisiones con una precisión notable.

De hecho, el modelo es tan bueno que ha obtenido tasas de victoria destacadas contra jugadores humanos reales en batallas reñidas de Pokémon.

¿IA de Pokémon?

Los investigadores de inteligencia artificial de la universidad se embarcaron en el desarrollo de un agente de IA de vanguardia. Este agente está impulsado por un modelo de inteligencia artificial que participa en el juego y aprende de él, emulando los procesos de aprendizaje y toma de decisiones humanas.

A diferencia del enfoque tradicional, en el que un jugador controlado por la máquina seguiría reglas preprogramadas, los desarrolladores de este modelo de IA afirman que evoluciona, prueba cosas nuevas y se comporta más como un jugador humano que como un algoritmo.

También está diseñado para funcionar en otros campos de batalla virtuales.

"POKE´LLMON es el primer agente***-+ LLM que logra un rendimiento equiparable al humano en juegos de batalla tácticos, como se demuestra en las batallas de Pokémon", escribió el equipo de investigación. "La arquitectura de POKE´LLMON es general y puede adaptarse para el diseño de agentes LLM en muchos otros juegos."

Imagen: Instituto de Tecnología de Georgia

El núcleo de la destreza de POKE´LLMON radica en su avanzado mecanismo de aprendizaje por refuerzo en contexto, que evoluciona de manera efectiva a medida que gana y pierde batallas, volviéndose cada vez más hábil en predecir y contrarrestar los movimientos de los oponentes.

Complementando su capacidad de aprendizaje, POKE´LLMON también aplica lo que sus creadores llaman una técnica de generación de conocimiento aumentada. Este enfoque permite que la IA integre conocimientos externos verificados en su proceso de toma de decisiones, asegurando una alta precisión y elecciones contextualmente relevantes durante las batallas.

Esta estrategia es especialmente útil para contrarrestar posibles alucinaciones, un desafío común en los sistemas de IA. Como se implementó, el juego de POKE´LLMON es tanto creativo como fundamentado en información sólida específica del juego.

Los desarrolladores también se aseguraron de que POKE´LLMON no sea un jugador tímido. El modelo aplica una técnica de generación de acciones consistente para asegurarse de que se mantenga compuesto y estratégicamente consistente, incluso cuando enfrenta oponentes formidables. Este aspecto de la implementación de la IA evita las decisiones impulsadas por el pánico que afectan a los competidores humanos.

"La generación de acciones condicionada por pensamientos de pánico lleva al agente a cambiar continuamente de Pokémon en lugar de atacar", señalan los investigadores. "En comparación, la generación de acciones consistente con SC (autoconsistencia) disminuye la proporción de cambio continuo al generar acciones de forma independiente varias veces y votar la acción más consistente".

El rendimiento de la IA en la arena o batallas es impresionante. Con una tasa de victorias del 49% en "competiciones de escalera" y una tasa de victorias aún más notable del 56% en batallas invitadas, ha demostrado su valía contra una variedad de desafiantes, humanos y no humanos.

No te dejes engañar por la atmósfera lúdica de Pokémon: hay un mundo de estrategia competitiva que explorar bajo su colorida superficie. Investigaciones como POKE'LLMON podrían servir como piedra angular para nuevos modelos que impulsen nuevos juegos.

El juego más comparable probablemente sea el ajedrez, y los sitios de ajedrez en línea detectan tramposos basándose en sus movimientos y la probabilidad de ejecutar un ataque en comparación con lo que un humano puede o haría. Los algoritmos informáticos están configurados para ejecutar el mejor movimiento en cada ocasión, lo que les da, o a las personas que los utilizan, una ventaja distintiva.

Sin embargo, con una IA adaptable y similar a la humana, estas herramientas de trampa pronto podrían quedar obsoletas, lo que haría que las batallas entre humanos y máquinas sean más divertidas y desafiantes.

Editado por Ryan Ozawa.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados