En Resumen

  • George Hotz publicó que la adopción masiva de agentes de IA en programación será "uno de los errores más costosos" del campo.
  • El hacker argumentó que los agentes generan código roto de forma cada vez más difícil de detectar, tras seis meses usándolos en proyectos reales.
  • Hotz advirtió que mientras los mejores programadores detectan los fallos, los menos experimentados los llevarán directo a producción.

George Hotz—el hacker que descifró el iPhone a los 17 años y realizó ingeniería inversa de la PlayStation 3 antes de que Sony lo demandara por ello—publicó el domingo una entrada en su blog argumentando que la adopción masiva de agentes de IA en programación terminará en desastre, o al menos algo cercano a eso.

"Lo digo ahora: la adopción de agentes de IA en el desarrollo de software será uno de los errores más costosos en la historia del campo", escribió Hotz. "Los agentes no saben programar, y cada vez tarda más en quedar claro que no pueden".

"El resultado es malo, pero de una manera que es cada vez más difícil de detectar. Que es exactamente lo que cabría esperar de un modelo estadístico cada vez más preciso".

La publicación, titulada "The Eternal Sloptember", llega cinco días después de que Andrej Karpathy, uno de los investigadores más destacados de la IA, se uniera al equipo de pre-entrenamiento de Anthropic con la visión explícita de que los agentes de IA ya han transformado el desarrollo de software. Ambos representan hoy los polos opuestos de un debate que la industria aún no ha resuelto, y los dos tienen credibilidad real para sostener su posición.

Hotz no llegó a esta conclusión desde la tribuna. Pasó seis meses usando agentes en proyectos reales: partes de Tinygrad, su framework de deep learning de código abierto, y la ingeniería inversa completa del firmware de un chip USB-PCIe. "El agente concentra todo el progreso al inicio", escribe, y luego te entrega lo que describe como la palanca de una tragaperras: la jalas y esperas que el trabajo final se complete.

Nunca termina de lograrlo.

No es un asunto de ego

Hotz anticipa la crítica obvia: un programador que define parte de su identidad a través de su oficio naturalmente resistiría las herramientas que amenazan con reemplazarlo. Toma la objeción en serio y la descarta por sus propios méritos.

"Pensé más en lo de la autoestima. El AFL de Google encontró más bugs que los LLMs y nadie se sintió así al respecto. El ajedrez y el Go son más populares que nunca", señaló Hotz. Y tiene razón en el sentido de que la IA en el ajedrez ha dominado a los humanos durante décadas y el juego solo ganó popularidad.

Su preocupación, entonces, no es ser reemplazado. Es lo que le ocurre a la calidad del código cuando todos usan estas herramientas al mismo tiempo, especialmente cuando las grandes tecnológicas y Wall Street presionan constantemente por su uso masivo.

"Casi pienso que esto es algún tipo de operación psicológica para vender agentes", afirma Hotz. "El miedo a perder es una de las pocas formas de hacer que las grandes empresas actúen. Aunque creo que en ese miedo están cometiendo un grave error".

Su argumento central es organizacional. Los de mejor desempeño tienen ciclos de retroalimentación lo suficientemente ágiles como para detectar los problemas generados por los agentes antes de que lleguen a producción. Leen el código, identifican los errores y calibran cuándo confiar en la herramienta. "Los de menor desempeño no tendrán esa capacidad de autocorrección", escribe, y son precisamente ellos quienes usan agentes para producir diez veces más de lo que producían antes. En una empresa grande, esa matemática genera algo concreto: una degradación más rápida de la calidad promedio del código, enmascarada por el volumen puro.

El resultado, argumenta, será "una era dorada de montones y montones de mediocridad, y una era oscura para las joyas de calidad". Como ejemplo concreto, señala los reportes de que Apple está implementando herramientas de programación con IA en toda su organización de ingeniería, y pregunta simplemente: "¿Creen que macOS mejorará o empeorará en los próximos 2 años?".

Dónde se ubican los bandos

Hotz se ubica ahora en lo que llama el "campo LeCun/Marcus", en referencia a Yann LeCun, científico jefe de IA de Meta, y Gary Marcus, un escéptico de larga data de los LLMs. Ambos han argumentado que los modelos de lenguaje son, en su esencia, sofisticados detectores de patrones: pueden imitar la distribución del código existente, pero no pueden razonar ante problemas genuinamente nuevos desde los primeros principios.

El Vibe coding—describir lo que quieres en lenguaje natural y dejar que la IA genere la implementación—se disparó durante el último año, y los principales laboratorios han posicionado la programación basada en agentes como su producto estrella. Microsoft transformó GitHub Copilot en un sistema completamente agéntico en 2025, con el CEO Satya Nadella describiéndolo como un cambio a nivel de plataforma comparable al paso a la nube.

La respuesta a la posición de Hotz no es abstracta. Karpathy, que había sido escéptico de los agentes a inicios de 2025, revirtió su postura tras los nuevos lanzamientos de modelos y se unió al equipo de pre-entrenamiento de Anthropic el 19 de mayo, cinco días antes de que Hotz publicara su entrada. Describió los próximos años en la frontera como "especialmente formativos".

El CEO de Anthropic, Dario Amodei, dijo en Davos que algunos ingenieros de Anthropic ya dejaron de escribir código ellos mismos, dejando que los modelos lo manejen mientras ellos revisan el resultado. Hotz, por su parte, afirma que intentó hacer lo mismo y que cada vez terminaba recurriendo a la corrección manual.

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.