La empresa matriz de Facebook e Instagram dice que ha desarrollado una tecnología de conversión de texto a voz basada en IA que puede identificar más de 4.000 lenguas. El objetivo, según Meta, es preservar las lenguas del mundo, y el gigante tecnológico está utilizando la Biblia y otros textos religiosos para lograrlo.

"Recopilar datos de audio de miles de lenguas fue nuestro primer reto, porque los mayores conjuntos de datos de habla existentes necesitan como máximo 100 lenguas", afirma Meta en una publicación en la que anuncia el proyecto. "Para superarlo, recurrimos a textos religiosos, como la Biblia, que se han traducido a muchas lenguas diferentes y cuyas traducciones se han estudiado ampliamente para la investigación de la traducción lingüística basada en textos".

En un documento de investigación adjunto elaborado por el equipo central de Meta AI, la empresa afirma que obtuvo sus datos de la Biblia, incluyendo texto original y grabaciones de audio de FaithComesByHearing.com, GoTo.Bible y Bible.com.

El proyecto incluye grabaciones de historias bíblicas, mensajes evangelísticos, lecturas de las Escrituras y canciones en más de 6.255 lenguas y dialectos. Aunque la mayoría de las grabaciones suelen estar protagonizadas por lectores masculinos, el Meta afirma que sus modelos funcionan igual de bien con voces femeninas.

Un conjunto de datos de lecturas del Nuevo Testamento, según Meta, proporcionó más de 1.100 lenguas que proporcionaron 32 horas de datos por lengua de media.

De acuerdo con el Centro de Lenguas Lingua del Broward College, hay más de 7.100 lenguas vivas en todo el mundo.

"Nuestras consultas con especialistas en ética cristiana concluyeron que la mayoría de los cristianos no considerarían el Nuevo Testamento, y sus traducciones, demasiado sagrados para ser utilizados en el aprendizaje automático", afirmó el equipo de Meta AI, añadiendo que no ocurre lo mismo con todos los textos religiosos.

"También existe el riesgo de que los datos de entrenamiento religiosos sesguen los modelos con respecto a una determinada visión del mundo", dijo Meta AI. "Sin embargo, nuestro análisis del lenguaje generado por nuestros modelos sugiere que el lenguaje producido por los modelos de reconocimiento del habla resultantes muestra sólo un pequeño sesgo en comparación con los modelos de referencia entrenados en otros dominios."

Después de que sus ambiciones metaversales se desvanecieran a principios de este año, Meta parece haber cambiado su enfoque hacia la inteligencia artificial, incluyendo la construcción de una herramienta de IA para identificar y separar elementos en imágenes y una herramienta impulsada por IA para ayudar a las marcas a dirigirse a los usuarios en sus plataformas de Facebook e Instagram.

Aunque la tecnología está aún en sus primeras fases, Meta afirma que está abriendo sus datos y su código para que otros puedan basarse en la plataforma, desarrollarla y mejorarla.

"Muchas de las lenguas del mundo corren peligro de desaparecer, y las limitaciones de la tecnología actual de reconocimiento y generación de voz no harán sino acelerar esta tendencia", afirma Meta. "Queremos facilitar a la gente el acceso a la información y el uso de dispositivos en su lengua preferida, y hoy anunciamos una serie de modelos de inteligencia artificial que podrían ayudarles a conseguirlo".

Daily Debrief Newsletter

Start every day with the top news stories right now, plus original features, a podcast, videos and more.