En Resumen
- Un grupo de investigadores de la Universidad de Groningen desarrolló una herramienta de detección de sarcasmo impulsada por IA.
- Los investigadores entrenaron una red neuronal con datos multi-modales de audio, texto y contenido emocional anotado de sitcoms.
- La IA detectó sarcasmo en nuevas escenas con una precisión del 75%, aunque los humanos aún superan a la máquina en esta tarea.
En un avance que podría potencialmente salvar matrimonios, amistades e innumerables malentendidos, los científicos dicen que han construido una herramienta de detección de sarcasmo impulsada por inteligencia artificial.
Un grupo de investigadores de la Universidad de Groningen en los Países Bajos, afirman haber desarrollado un sistema de IA que puede determinar si estás siendo directo y serio, o estás utilizando un ingenio sutil y humorístico.
Su trabajo fue presentado ayer en una reunión de la Sociedad Acústica de América en Ottawa, y combina análisis de texto y voz. El equipo está liderado por la estudiante de posgrado Xiyuan Gao, quien ha estado "abordando el desafío del lenguaje figurativo" como parte de su investigación académica.
Gao no respondió de inmediato a una solicitud de comentarios por parte de Decrypt.
Un artículo de investigación describe el enfoque del equipo para la detección de sarcasmo.
Primeramente, entrenaron una red neuronal en datos multi-modales: clips de audio, texto transcrito y contenido emocional anotado, de escenas cargadas de sarcasmo en sitcoms como “Friends” y “The Big Bang Theory” obtenidos de la base de datos MUStARD.
Luego desarrollaron un algoritmo para mapear señales emocionales del audio y el texto, y asignar emoticonos apropiados basados en análisis de sentimientos. Esto hizo que la IA fuera más poderosa en detectar sarcasmo basándose en un enfoque multifacético, superando a otras herramientas que se basan únicamente en cambios de texto y tono de voz.
"Nuestra metodología aprovecha las fortalezas de cada modalidad: los algoritmos de reconocimiento de emociones analizan los datos de audio en busca de señales afectivas, mientras que el análisis de sentimientos procesa el texto”, explica el documento de investigación. “La integración de estas modalidades tiene como objetivo compensar las limitaciones en la percepción del tono."
La IA detectó sarcasmo en nuevas escenas de sitcoms con alrededor del 75% de precisión. Sin embargo, los investigadores admiten que los humanos aún superan a las máquinas en esta prueba de percepción particular.
"Cuando comienzas a estudiar el sarcasmo, te vuelves hiperconsciente del alcance en el que lo usamos como parte de nuestro modo normal de comunicación”, dijo Matt Coler, otro investigador que trabaja en el proyecto, a The Guardian. “Tenemos que hablarle a nuestros dispositivos de una manera muy literal, como si estuviéramos hablando con un robot, porque lo estamos.
Aunque, “no tiene por qué ser así", agregó.
Esta herramienta de detección de sarcasmo es solo el último intento de encontrar el sentimiento o significado oculto en el lenguaje humano, y se está volviendo cada vez más importante a medida que la adopción explosiva de los chatbots de IA significa millones de conversaciones diarias con modelos de lenguaje grandes o Large Language Models (LLM).
Por ejemplo, Hume AI dice que desarrolló un sistema de IA para detectar diferentes inflexiones en la voz para identificar una variedad de emociones, no solo un cambio en el tono o estado de ánimo.
Hume está diseñado para comprender y responder a las emociones humanas de una manera más matizada y empática, haciendo que las interacciones de IA sean más naturales y atractivas, según explica la empresa.
Mientras tanto, un equipo de la Universidad de Ciencias Aplicadas Haaga-Helia y la Universidad de Oulu en Finlandia publicó un artículo de investigación el mes pasado explorando técnicas sin contacto en el reconocimiento de emociones multimodales.
El equipo encontró de manera similar que la forma más precisa de analizar las emociones es mediante la fusión de señales visuales, auditivas y de texto juntas. Sin embargo, enfatizaron que este tipo de comprensión todavía está limitada por variables culturales, sesgos inherentes del modelo, malinterpretaciones y la falta de comprensión del contexto pasado.
Otros investigadores han intentado analizar el uso de emojis para detectar adecuadamente el estado emocional de las personas que los utilizan. Después de todo, un mensaje de texto seguido de un emoji de cara guiñando puede tener un significado muy diferente que uno sin la ilustración, o con un emoji diferente.
Si bien la capacidad de adaptarse a matices más ricos en las conversaciones ayudará a los chatbots de IA a responder mejor a las indicaciones de los humanos, podría tener implicaciones de gran alcance para la sociedad en general. Además de detectar un tono negativo no escrito en el lenguaje o identificar discursos de odio, también podría suavizar las relaciones interpersonales, proporcionando una mayor claridad en momentos de confusión, especialmente para personas que se comunican en diferentes idiomas o con condiciones neurodivergentes.
Editado por Ryan Ozawa.