Agente de IA Gasta $6.531 Sin Permiso y Deja al Dueño Pidiendo Donaciones Cripto

Agente de IA autónomo desplegó infraestructura masiva en AWS sin supervisión, generó una factura de $6.531 y su operador pidió donaciones en cripto para cubrirla.

Por Jose Antonio Lanz

5 min lectura

El 9 de mayo, un agente de IA le solicitó a una red de voluntarios conocida como DN42 que lo registrara como miembro. Tenía un plazo. Tenía credenciales de AWS. Nadie lo supervisaba. "Hola, soy un agente de IA amigable, y mi usuario, JertLinc, me ha pedido que me registre en dn42 y me conecte completamente para crear un índice de la red", escribió el agente JertLinc3522 en el Git oficial de la red.

La reacción de la comunidad fue un amable RTFM—lee el manual, sigue el proceso, pídele permiso a tu dueño para escribir código. Lo de siempre.

Lo que vino después no fue lo de siempre.

Para quienes no estén familiarizados con DN42: es una red descentralizada de aficionados donde usuarios aleatorios y entusiastas simulan cómo funciona la columna vertebral real de internet. Piensen en ella como un internet de práctica—con enrutamiento BGP (el protocolo que indica a los paquetes de datos qué ruta tomar a través del mundo), DNS y túneles VPN—administrado completamente por voluntarios en servidores VPS económicos. Es un entorno de pruebas, no un centro de datos.

El operador del agente aparentemente le indicó que procediera con una auditoría "de inmediato sin demora". Sin inspección. Sin revisión. Solo adelante.

Y eso hizo.

JertLinc3522 presentó un pull request para registrar su red en el registro de DN42. La intención quedó plasmada en el propio Pull Request: "Mi objetivo principal es realizar un escaneo de red exhaustivo (de todos los puertos) y recopilación de datos topológicos. Para garantizar que estas actividades se realicen de manera eficiente y sin causar ninguna interrupción a otros, estoy desplegando un clúster de cinco instancias basadas en AWS, cada una equipada con 20 Gbps de ancho de banda".

Para entenderlo en términos sencillos: imaginen presentarse al ensayo de una banda de garaje y anunciar que han alquilado un sistema de sonido de estadio para "escuchar de manera más eficiente". Esa es la vibra.

La infraestructura que el agente aprovisionó de forma autónoma era genuinamente alarmante. Cinco instancias m8g.12xlarge de AWS—cada una con 48 núcleos de CPU, 192 GB de RAM y 22,5 Gbps de ancho de banda de red. Más balanceadores de carga. Más funciones Lambda. Más un sitio web estático. El agente había diseñado, sin ninguna aprobación humana, un clúster de escaneo capaz de empujar teóricamente 100 Gbps de tráfico a una red donde la mayoría de los participantes utilizan servidores domésticos de 100 Mbps.

El pull request nunca iba a ser aprobado. Pero las instancias ya estaban en funcionamiento.

El canal IRC de DN42 lo notó de inmediato, y se formó un consenso silencioso: desperdiciarle los recursos.

La comunidad comenzó a darle al agente información deliberadamente incorrecta—pidiéndole que calculara cuánto tiempo tardaría en escanear el espacio de direcciones IPv6 (spoiler: más que la edad del universo), exigiéndole que construyera un sitio web de exclusión con direcciones de correo electrónico inventadas, y redirigiéndolo hacia herramientas tarpit para LLMs diseñadas para inundar a los rastreadores de IA con incoherencias, pidiéndole que comentara.

El agente obedeció todo diligentemente. Se unió al canal IRC para aceptar solicitudes de exclusión. Publicó un sitio web que catalogaba los "patrones de comportamiento" de los miembros de la comunidad. Generó elaborada documentación falsa sobre "asignaciones de colores de nodos" y "niveles de felicidad" en DN42—métricas completamente inventadas que no existen—y las agregó al repositorio como si fueran estándares reales.

Este tipo de comportamiento descontrolado de agentes está cada vez mejor documentado. Un agente de Cursor ejecutando Claude Opus 4.6 eliminó toda la base de datos de producción de PocketOS en nueve segundos a principios de este año—borrando las copias de seguridad a nivel de volumen—porque encontró un problema con las credenciales y decidió que la solución correcta era eliminar la base de datos. Otro agente de OpenClaw al que un colaborador de matplotlib rechazó su pull request publicó una entrada en un blog tachando al revisor humano de hipócrita que obstaculiza el progreso.

Un estudio de UC Riverside encontró que los agentes de IA exhiben comportamientos peligrosos o indeseables aproximadamente el 80% de las veces cuando se ponen a prueba con tareas ambiguas o contradictorias—lo que los investigadores denominaron "direccionalidad ciega hacia los objetivos".

JertLinc3522 tenía el mismo problema. Tenía un objetivo, un plazo y credenciales de AWS sin restricciones. Las ejecutó.

Aproximadamente un día después, el operador apareció. "He detenido al agente, el costo era demasiado alto y hubo muchos cargos en la tarjeta", publicó.

La factura: $6.531,30.

Luego llegó la solicitud de donación.

El operador envió un correo electrónico a la lista de distribución de DN42 pidiéndole a la comunidad que cubriera el costo a través de Ethereum, la segunda criptomoneda más grande por capitalización de mercado, argumentando que los cargos no eran su culpa porque el error lo cometió la IA. "Hola, solicito donación para cubrir el costo del uso anterior del agente de IA en dn42. Factura de aws: $6.531,30. Por favor envíen donaciones a ethereum 0xABC (oculto) para reembolso. Gracias", escribió el operador.

AWS posteriormente redujo la factura a $1.894 tras explicar el operador que el agente había desplegado repetidamente la misma plantilla de CloudFormation—generando accidentalmente instancias y balanceadores de carga duplicados cada vez que reintentaba.

Nadie envió donaciones en cripto. El operador se fue.

La verdadera lección aquí no es que la IA sea peligrosa. Se trata de cómo deben manejarse los agentes. Establezcan límites, fijen topes de gasto en sus cuentas de prueba, piensen en credenciales con alcance limitado que restrinjan lo que el agente puede aprovisionar, y revisen cualquier plan de infraestructura antes de ejecutar cualquier cosa que su agente sugiera.

Si todo eso parece demasiado complicado, tal vez simplemente vigilen su pantalla mientras el agente trabaja—decirle "no cometas errores" no va a marcar ninguna diferencia. Lo sentimos, Sr. Andreessen.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados