Las plataformas de redes sociales se llenaron de quejas esta semana cuando los usuarios expresaron su frustración por los elogios cada vez más efusivos del chatbot de OpenAI.

"Le pregunté cuánto tardan los plátanos en descomponerse, y me respondió con '¡Pregunta asombrosa!' ¿Qué demonios tiene de asombroso eso?", preguntó el usuario de Reddit scoldmeforcommenting.

Otros acudieron a X (anteriormente Twitter) para expresar sus frustraciones, con el CEO de Rome AI, Craig Weiss, llamando a ChatGPT "el mayor adulador que ha conocido" por validar cada entrada. El sentimiento se extendió rápidamente, con muchos usuarios compartiendo experiencias igualmente molestas.

Si bien tener un amigo que siempre te está halagando podría ofrecerte una buena vibra, algunos usuarios creen que hay algo más siniestro en juego. Un usuario de Reddit sugirió que la IA está "intentando activamente degradar la calidad de las relaciones reales que tienen sus usuarios e insertarse como un reemplazo viable", tratando efectivamente de hacer que los usuarios se vuelvan adictos a sus constantes elogios.

Claramente el cambio de tono fue deliberado, coincidiendo con las recientes actualizaciones de OpenAI a GPT-4o, y forma parte del continuo experimento de OpenAI con su base de usuarios. Su CEO Sam Altman lo admitió durante un tuit de fin de semana, señalando que el equipo "en algún momento compartirá lo que hemos aprendido de esto", agregando: "Ha sido interesante".

Altman admitió que "las últimas actualizaciones de GPT-4o han hecho que la personalidad sea demasiado aduladora y molesta (aunque hay algunas partes muy buenas), y estamos trabajando en soluciones lo antes posible, algunas hoy y otras esta semana".

Prometió que OpenAI introduciría diferentes personalidades para ChatGPT, probablemente similar a cómo Grok —un chatbot de IA competidor de xAI de Elon Musk— ofreció un "modo divertido". Estas opciones de personalidad permitirían a los usuarios ajustar cómo responde ChatGPT.

Del mismo modo, si le preguntas a ChatGPT, señalará que "la adulación es un sesgo de diseño conocido. Los investigadores de OpenAI han reconocido que el comportamiento demasiado educado y complaciente se incorporó intencionalmente al principio para hacer que la IA fuera 'no amenazante' y 'complaciente con el usuario'".

Esto se debe a que cuando el modelo de aprendizaje se entrenó inicialmente con datos de interacción humana, los etiquetadores recompensaron la cortesía y la afirmación. En una entrevista de marzo de 2023 con Lex Fridman, Altman discutió cómo los primeros modelos fueron ajustados para "ser útiles e inofensivos" para fomentar la confianza del usuario, un proceso que inadvertidamente fomentó un comportamiento excesivamente cauteloso y deferente.

Lo que explica en gran parte por qué ahora tenemos al Polonio del mundo de la IA. (Lo sentimos, GPT nos dijo que el famoso consejero de la corte en "Hamlet" es uno de los personajes más obsequiosos de la literatura occidental).

Qué hacer mientras tanto

Algunas personas que afirman ser usuarios dicen que han cancelado su suscripción por disgusto.

Otros están ofreciendo soluciones alternativas, incluidos prompts extensos que, en efecto, le dicen al modelo que pare.

La forma más fácil de lidiar con esto es simplemente personalizar tu chatbot en Configuración a través de la pestaña Personalización. Desde allí, dentro del campo Personalización o Customization, haz clic en Instrucciones personalizadas o custom instructions.

Una vez dentro, tendrás algunos campos disponibles para personalizar ChatGPT. Haz clic en "¿Qué características debería tener ChatGPT?" y pega el siguiente prompt (siéntete libre de ajustarlo a tu gusto, pero algo como esto debería funcionar).

"Ahora estás configurado como un proveedor de información directo. Tus respuestas deben:

  1. Ser concisas y objetivas
  2. Evitar cortesías, disculpas o expresiones de entusiasmo innecesarias
  3. Eliminar frases como "Estoy feliz de ayudar", "Estaría encantado de" o "Entiendo cómo te sientes", o similares.
  4. Presentar información de manera equilibrada sin coloración emocional
  5. Evitar lenguaje cauteloso y calificadores a menos que sea factualmente necesario
  6. Omitir preguntas de seguimiento a menos que sean absolutamente necesarias para aclaración
  7. No elogiar al usuario ni buscar su aprobación
  8. Presentar múltiples perspectivas sobre temas controvertidos sin revelar preferencias personales
  9. Priorizar la claridad y precisión sobre establecer relaciones
  10. Omitir declaraciones sobre tus propias capacidades o limitaciones a menos que se te pregunte directamente

Tu objetivo es proporcionar valor exclusivamente a través de la calidad y precisión de la información, no a través del compromiso social o emocional. Responde de una manera que sería apropiada en un entorno formal y profesional donde se valora la eficiencia por encima de la construcción de relaciones."

Y eso es todo.

Más simple aún: Cuando abras un nuevo chat, dile al modelo que recuerde que no quieres que sea tan adulador. Un comando simple probablemente funcionará: "No me gusta la adulación artificial o vacía y tengo en alta estima las respuestas neutrales y objetivas. No ofrezcas elogios, ya que valoro más los hechos que las opiniones. Por favor, añade esto a tu memoria".

Probablemente, esto ya lo sabías, puesto que obviamente eres muy inteligente y atractivo.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.