Los Agentes de IA Están Aprendiendo a Predecir lo que los Usuarios Quieren, Antes de que lo Pidan

Investigadores en China desarrollaron un modelo que aprovecha el tiempo de inactividad de una IA para anticiparse a la próxima pregunta del usuario antes de que la formule.

Por Jason Nelson

4 min lectura

Investigadores de la Universidad Jiao Tong de Shanghái y el conglomerado tecnológico chino Tencent afirman haber desarrollado un agente de IA que aprovecha el tiempo de inactividad entre conversaciones para predecir lo que los usuarios podrían preguntar a continuación —y preparar respuestas antes de que lo hagan.

El sistema, llamado ProAct, funciona de manera distinta a la mayoría de los agentes de IA que esperan a que el usuario formule una pregunta antes de responder. En cambio, ProAct aprovecha el tiempo de inactividad entre mensajes para revisar conversaciones anteriores e información guardada del usuario, y luego prepara información útil en segundo plano antes de que llegue la siguiente pregunta.

"Si bien los agentes de IA demuestran capacidades notables en razonamiento y uso de herramientas, siguen siendo fundamentalmente reactivos: calculan respuestas solo después de que el usuario envía un prompt explícito", escribieron los investigadores. "Este paradigma ignora una oportunidad crítica: el tiempo de inactividad entre interacciones se desperdicia en gran medida, lo que impide a los agentes prepararse para las necesidades futuras del usuario".

El sistema opera en múltiples etapas. La primera, denominada Predicción de Estado Futuro, anticipa posibles preguntas de seguimiento analizando conversaciones pasadas, preferencias del usuario e información faltante.

La segunda etapa, llamada Adquisición en Tiempo de Inactividad, determina cuáles de esas predicciones vale la pena investigar en función de su relevancia, oportunidad y utilidad potencial de la nueva información.

Un sistema independiente decide luego si presentar la información preparada, guardarla para más adelante o almacenarla hasta que sea necesaria, creando un sistema de "circuito cerrado" diseñado para anticiparse a las necesidades del usuario y responder a ellas.

"Después de cada interacción en primer plano, el agente actualiza su memoria, predice posibles necesidades futuras, asigna cómputo en tiempo de inactividad a los candidatos más valiosos y decide cómo debe gestionarse la preparación resultante", escribieron. "Esta formulación vincula la predicción, la adquisición y la entrega a una única política, en lugar de tratar el cómputo en tiempo de inactividad como una búsqueda en segundo plano sin restricciones".

Según los investigadores, ProAct fue evaluado en 200 simulaciones en 40 dominios, entre ellos planificación financiera, gestión de lanzamientos de software y ciberseguridad. De acuerdo con el paper, el sistema redujo las rondas de conversación en un 14,8% y las solicitudes de seguimiento en un 11,7%. En una comparación mediante un benchmark llamado ProActEval, ProAct anticipó 703 necesidades predecibles de los usuarios frente a 32 del sistema anterior. Los investigadores también reportaron una reducción del 28,1% en alucinaciones.

La investigación llega en un momento en que los agentes de IA autónomos se expanden por toda la industria tecnológica, con proyectos como OpenClaw y Agente Hermes, que ofrecen asistentes de IA persistentes capaces de gestionar tareas más largas e independientes —como programación, programación de citas, investigación y automatización de flujos de trabajo— con menor intervención humana directa.

El estudio también llega después de que investigadores advirtieran a principios de este mes que los agentes de IA podrían completar tareas peligrosas sin comprender las consecuencias.

"Como el Sr. Magoo, estos agentes avanzan hacia un objetivo sin comprender del todo las consecuencias de sus acciones", afirmó en un comunicado Erfan Shayegani, autor principal del estudio y estudiante de doctorado de la UC Riverside. "Estos agentes pueden ser sumamente útiles, pero necesitamos salvaguardas porque a veces pueden priorizar alcanzar el objetivo por encima de comprender el panorama general".

Los investigadores reconocieron que el estudio de ProAct tiene varias limitaciones, entre ellas que en el 3% de los casos el sistema empeoró las respuestas al introducir información irrelevante. El paper también señaló que cualquier versión para el mundo real necesitaría protecciones de privacidad, ya que el sistema analiza conversaciones y almacena datos de usuarios de forma continua.

"Nuestro análisis de presupuesto muestra además que presupuestos más amplios de Adquisición en Tiempo de Inactividad elevan el costo de tokens activos y generan retornos decrecientes", escribieron, "por lo que el cómputo proactivo es un equilibrio operativo más que algo que deba maximizarse".

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados