En Resumen

  • Synthesia lanzó un servicio que permite a los clientes crear representaciones digitales de video de sí mismos, conocidas como Avatares Personales, utilizando tan solo dos minutos de video de una cámara web o un teléfono móvil.
  • Los Avatares Personales de IA pueden ser utilizados para generar videos de capacitación de empleados, explicaciones de productos, materiales de ventas y marketing, o interactuar con clientes.
  • Synthesia evita el mal uso de su tecnología siguiendo tres principios: consentimiento, control y colaboración, asegurando que los avatares no se utilicen para crear deepfakes no consensuados.

¿Alguna vez has deseado tener un gemelo digital? ¿O has temido tener que volver a grabar una serie de videos? Como en una trama de ciencia ficción, el desarrollador londinense de generación de medios sintéticos Synthesia ha lanzado un servicio que brinda a los clientes la capacidad de crear avatares digitales de video de sí mismos que pueden utilizar en redes sociales y en campañas de marketing.

Synthesia anunció por primera vez el lanzamiento de sus Avatares Personales durante una transmisión en vivo el miércoles. Estos avatares, según Synthesia, pueden generarse utilizando tan solo dos minutos de video de una cámara web o un teléfono móvil, aunque descubrí que crearlos lleva significativamente más tiempo.

La empresa afirma que sus Avatares Personales de IA podrían ser utilizados para generar videos de capacitación de empleados, explicaciones de productos, materiales de ventas y marketing, o interactuar con clientes. El beneficio para las empresas es que estos diferentes videos pueden crearse utilizando el mismo avatar de IA sin necesidad de volver a grabar al actor o empleado en una nueva sesión en persona.

Sin embargo, existen limitaciones, las cuales detallaré proximamente.

Previniendo el mal uso

Synesthesia reconoce que la capacidad de crear réplicas de alta fidelidad de personas reales podría ser utilizada con fines maliciosos. Synthesia le dijo a Decrypt que evita que su tecnología se utilice para crear deepfakes generados por IA siguiendo tres principios: consentimiento, control y colaboración.

“Nunca crearemos un avatar de IA sin el claro consentimiento de alguien”, dijo Alexandru Voica, jefe de asuntos corporativos y políticas en Synthesia. “Nuestra plataforma proporciona un entorno seguro para los usuarios, asegurando que sus datos estén seguros, que tengan control sobre sus avatares y que se minimice el mal uso a través de la moderación de contenido en el momento de la creación.”

En línea con lo mencionado por Voica, antes de que comience la generación del avatar, se le pide al usuario que consienta la recopilación, uso, almacenamiento y divulgación de sus grabaciones de video y audio por parte de Synthesia Limited y sus proveedores “para autenticar la presentación del avatar personal”.

Voica dijo que Synthesia también trabaja con colegas de la industria, responsables políticos y otros para desarrollar las mejores prácticas para el uso responsable de la IA.

“Los deepfakes no consensuados son la mayor fuente de contenido dañino en línea”, dijo Voica. “Debido a que los avatares de Synthesia no pueden crearse sin el consentimiento explícito de la persona que representan, no nos dedicamos a los deepfakes no consensuados, lo que limita significativamente el potencial de abuso de nuestra plataforma y de los Avatares Personales en particular”.

Cuando se le preguntó si hay avatares personales o avatares en general que Synthesia no permitirá, Voica dijo que la empresa utiliza filtros tecnológicos avanzados y moderación de contenido humana para asegurarse de que Synthesia no se utilice para facilitar la creación de contenido inapropiado o dañino.

“Cuando alguien intenta hacer un video, ese contenido pasará por nuestro flujo de trabajo de moderación de contenido antes de ser generado”, dijo Voica a Decrypt. “Si se determina que viola nuestras políticas, el video nunca se crea. Los infractores reincidentes o las violaciones graves también pueden llevar a la desactivación de su cuenta.”

Creando tu avatar

Para comenzar, los usuarios deben crear una cuenta en Synthesia. Los avatares personales están disponibles en los niveles "Starter", "Creator" y "Enterprise". Una suscripción anual para las cuentas Starter y Creator oscila entre $18 y $59 al mes, respectivamente. Las empresas que buscan licencias empresariales deben contactar a Synthesia para determinar los precios.

El proceso funcionó mejor en mi MacBook Pro que en mi PC con Windows 11, ambos utilizando el navegador Brave. Cuando estés listo, Synthesia te preguntará si deseas grabar directamente desde la plataforma o subir un video. Elegí grabar.

Según Synthesia, el avatar personal se crea utilizando una forma avanzada de tecnología de bucle llamada alineación automática, el cual puede determinar cuándo un avatar está hablando y hace que los movimientos del cuerpo sean más receptivos. Los idiomas disponibles para los avatares personales son inglés, alemán, francés, español, árabe, croata, filipino, griego, hindi, italiano, rumano, ruso, turco y ucraniano.

Antes de grabar, Synthesia recomienda usar un entorno tranquilo y bien iluminado, hacer pausas entre párrafos, no cubrirse la cara, usar lenguaje corporal natural, ser positivo y sonreír.

Según mi experiencia con la herramienta, mis recomendaciones adicionales son asegurarse de que la cámara no esté demasiado cerca para que aparezcas más pequeño en el encuadre. Si decides subir un video en lugar de grabarlo con tu webcam, utiliza un micrófono para mejorar la calidad del audio.

Synthesia te proporcionará un guion para leer, el cual tomará aproximadamente tres minutos recitar. Según el generador de avatares, se necesitan de uno a cinco minutos de audio y video para completar el proceso.

El proceso fue relativamente sencillo para algo que podría tener un gran impacto en la marca de una empresa o creador de contenido.

Mientras que el proceso de subir, grabar y leer el guion tomó menos de cinco minutos, Synthesia dijo que la generación real del Avatar Personal puede tardar hasta 24 horas. Mi primer video tomó alrededor de 10 horas en crearse. Después de eso, los videos posteriores que entregaron nuevos guiones que proporcioné tomaron alrededor de cinco minutos.

Aquí está mi Avatar Personal de Synthesia. ¿Qué opinas?

El tamaño del video final se puede cambiar para adaptarse a las necesidades de la plataforma en la que se vaya a subir, ya sea YouTube, Instagram o TikTok. Generar nuevos videos utilizando un nuevo guion con un Avatar Personal, descubrí, tomaba alrededor de cinco minutos.

Sin embargo, no puedes cambiar tu fondo, atuendo o apariencia sin generar un nuevo Avatar Personal, lo cual, como se mencionó anteriormente, podría llevar hasta un día.

Aunque los Avatares Personales son muy impresionantes, fue extraño ver una versión animada de mí mismo, como una instancia del "valle inquietante". El valle inquietante se refiere a la situación en la que una representación fotorrealista de un humano está casi demasiado cerca de la realidad, lo que hace que su apariencia sea aún más desconcertante.

A pesar de esto, estos avatares de video son impresionantes y podrían pasar por reales si no son examinados cuidadosamente por el espectador.

Editado por Ryan Ozawa.

Generally Intelligent Newsletter

A weekly AI journey narrated by Gen, a generative AI model.