En Resumen

  • OpenAI anunció que pausó el desarrollo del sistema de voz "Sky" debido a la controversia y comentarios sugestivos.
  • Scarlett Johansson contrató asesoría legal tras rechazar solicitudes para usar su voz, exigiendo explicaciones a OpenAI.
  • OpenAI declaró que la voz de "Sky" no imitaba a Johansson y fue creada por una actriz profesional diferente.

Resultó que todas las bromas sobre la película de ciencia ficción de Inteligencia artificial "Her"—que incluso el CEO de OpenAI, Sam Altman, alentó—no eran motivo de risa.

Después de que OpenAI lanzara su modelo de lenguaje multimodal GPT-4o presumiendo su capacidad de interactuar a través de voz, la compañía anunció el lunes que está pausando el desarrollo del sistema de voz llamado “Sky”. La decisión llegó en medio de una ola de comentarios sugestivos, memes y comparaciones con el personaje de “Her”, interpretado por Scarlett Johansson.

En cuestión de horas, la actriz emitió un comunicado anunciando que había contratado asesoría legal después de haber rechazado dos veces las solicitudes para usar su voz antes de la presentación de la semana pasada.

"Me sorprendió, enfureció y no podía creer que el Sr. Altman persiguiera una voz que sonaba tan extrañamente similar a la mía," dijo Johansson. Sus abogados enviaron cartas a Altman y OpenAI, pidiéndoles que explicaran cómo crearon la voz de “Sky”.

Notablemente, Altman tuiteó de forma críptica una única palabra “Her” justo antes de la presentación, posiblemente unas horas antes de su segundo intento de asegurar la participación de Johansson, una acción destacada en su declaración.

La respuesta de OpenAI, incluyendo una publicación detallando cómo se desarrollaron las voces, parece responder directamente a una de las preguntas de Johansson.

"Hemos escuchado preguntas sobre cómo elegimos las voces en ChatGPT, especialmente Sky. Estamos trabajando para pausar el uso de Sky mientras las abordamos", declaró OpenAI ayer.

Joanne Jang, líder de comportamiento modelo en OpenAI, reconoció la confusión y las preocupaciones en torno al modelo de voz "Sky", diciendo a The Verge, "Queremos tomar en serio los comentarios y escuchar las preocupaciones".

OpenAI presentó las nuevas voces la semana pasada como una demostración de los esfuerzos de la compañía para proporcionar conversaciones más humanas y naturales con su chatbot de IA. El modelo de voz fue diseñado para comprender y responder a las señales emocionales, mostrando las capacidades avanzadas de GPT-4o, pero con toques humanos como pausas, suspiros y risas.

Una vez que estuvo disponible para el público, los usuarios comenzaron a probar los límites del modelo y coquetear con la voz. Una avalancha de tweets describía a Sky como "coqueta", "sexy" y "provocativa", con algunos usuarios bromeando que ahora tenían una nueva novia o estaban siendo seducidos por la voz de IA.

El filme de Spike Jonze de 2013 "Her" fue un punto de comparación constante, una película en la que Scarlett Johansson prestó su voz a una asistente de inteligencia artificial que enamora a un escritor solitario. La situación se intensificó con sketches de comedia haciendo referencia a las seductoras voces de Sky y la aparente similitud con la actriz, reconocida incluso por el cofundador de OpenAI, Andrej Karpathy.

El viernes, el CEO Sam Altman tuiteó sobre posibles cambios en Sky, asegurando a las personas que el nuevo modelo no estaba disponible públicamente.

El domingo, la empresa dio sus primeros pasos oficiales para abordar la creciente controversia, explicando que trabajó con actores de voz para seleccionar y entrenar sus modelos de voz. En la publicación de blog, la empresa negó haber utilizado la voz de Johansson como plantilla para "Sky", actriz profesional.

"Trabajamos con profesionales líderes en la industria de casting y dirección para reducir más de 400 presentaciones antes de seleccionar las cinco voces", explicó OpenAI. "Cada una de las voces - Breeze, Cove, Ember, Juniper y Sky - se muestrean de actores de voz con los que colaboramos para crearlas".

"Creemos que las voces de IA no deben imitar deliberadamente la voz distintiva de una celebridad: la voz de Sky no es una imitación de Scarlett Johansson, sino que pertenece a una actriz profesional diferente que utiliza su propia voz natural para hablar", señala la publicación.

OpenAI dijo que no revelaría la identidad de los actores por razones de privacidad. La empresa también reveló que planea introducir voces adicionales en el futuro para que coincidan mejor con los diversos intereses y preferencias de los usuarios.

Editado por Andrew Hayward. Este artículo ha sido actualizado para incluir una declaración oficial de Scarlett Johansson.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.