¿ChatGPT Puede Jugar Doom? Sí, Pero es Terrible

Un investigador de la Universidad de York utilizó ChatGPT para jugar un shooter clásico en primera persona, pero los resultados fueron dolorosos.

Por Jason Nelson

Mar 16, 2024

3 min lectura

Doomguy after ChatGPT tries playing, probably. Image: id Software

Add on Google

En Resumen

Ingenieros, investigadores y aficionados han demostrado que Doom se puede jugar en casi cualquier cosa, incluso bacterias intestinales.
La ejecución de Doom en ChatGPT requirió emparejarlo con GPT-4V para que el chatbot pudiera jugar.
Los resultados mostraron que el modelo de IA no pudo ejecutar Doom de forma independiente debido a limitaciones en la entrada y renderizado de imágenes.

Ingenieros, investigadores e intrépidos aficionados de todo tipo han demostrado que el clásico juego de disparos en primera persona Doom se puede jugar en casi cualquier cosa, incluyendo un cortacésped e incluso bacterias intestinales. El miércoles, Adrian de Wynter, un destacado científico en Microsoft, demostró que el popular chatbot de IA ChatGPT puede jugar a Doom, aunque no es muy bueno en ello.

La exploración de los diferentes dispositivos y otras invenciones en los cuales se puede ejecutar Doom se ha convertido en un pasatiempo crecientemente popular entre hackers, investigadores y apasionados de la tecnología. Para hacer que Doom funcione con ChatGPT, de Wynter lo emparejó con el GPT-4V multimodal de OpenAI (Vision) para que el chatbot pudiera jugarlo.

Los resultados del experimento Doom/ChatGPT mostraron que a pesar de los avances en GPT-4 y su variante mejorada en visión, el modelo de IA no pudo ejecutar Doom de forma independiente debido a limitaciones en la entrada y renderizado de imágenes.

“Por ejemplo, si el modelo caía en un charco de ácido, y luego quedaba atrapado en una pared, 'olvidaría' que está recibiendo daño debido al ácido”, dijo de Wynter, “y luego se quedaría atascado y moriría”.

Otro problema que enfrentó de Wynter era la tendencia del modelo de IA a alucinar e inventar explicaciones para sus acciones, o mentir diciendo que completó una acción. Eso dejaba al Marine Espacial de Doom a merced de monstruos desenfrenados.

GPT-4, logró llegar a la última habitación del juego... pero solo una vez. La simplicidad de Doom, dijo que facilita trabajar con él debido a su portabilidad, y su naturaleza de código abierto permite mejores referencias con las cuales medir a los agentes inteligentes, ya que Doom requiere capacidades de razonamiento pesadas, como planificar en el momento de la acción.

“¡Es interesante!”, dijo de Wynter a GG de Decrypt. “Principalmente, se originó como un meme (‘¿Puede mi tostadora ejecutar Doom?’) debido a su portabilidad y código abierto. Esa es principalmente la razón por la que se mantiene como el juego de elección.”

De Wynter enfatizó que el proyecto fue realizado únicamente en su capacidad como investigador en la Universidad de York, y no está relacionado en absoluto con su trabajo en Microsoft.

“La depuración llevó mucho tiempo. Normalmente, volcaba los fotogramas y los revisaba para asegurarme de que nada se rompiera,” dijo, señalando problemas constantes. “Finalmente, me rendí y convertí los fotogramas en GIFs."

El proyecto de Wynter es solo el último de una serie de experimentos que tienen como objetivo jugar a Doom en lugares inusuales.

El año pasado, después del lanzamiento del protocolo Ordinals, una versión simplificada de Doom fue inscrita en la blockchain de Bitcoin con el número 466. A principios de este año, un proyecto similar añadió una versión completa de Doom a la blockchain de Dogecoin.

Si bien este intento de hacer que la IA juegue Doom puede ser único, de Wynter dijo que tiene ideas para futuros experimentos de juegos utilizando modelos de lenguaje grandes (LLMs).

“Mi principal interés de investigación está relacionado con las capacidades de razonamiento y planificación de LLM, por lo que los juegos, en general, son un excelente banco de pruebas para esto”, dijo. “Los juegos de estrategia están un poco fuera de la mesa en este momento, pero me pregunto si juegos más simples (u otros modelos) podrían dar mejores resultados.”

Editado por Andrew Hayward

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.

Coin Prices