OpenAI Entrenó Modelos de IA en Trabajos Con Derechos de Autor, Según Demanda Del NYT

Los métodos actuales para entrenar la IA en obras con derechos de autor significa que "se producirá menos periodismo y el costo para la sociedad será enorme", según el NYT.

Por Jose Antonio Lanz

5 min lectura

The New York Times ha presentado una demanda contra OpenAI y Microsoft, alegando que millones de sus artículos fueron utilizados de manera incorrecta para entrenar modelos de IA que ahora son competidores directos en el ámbito de la información y las noticias.

La demanda dice que OpenAI "utilizó el contenido de The Times sin pagar para crear productos que sustituyen a The Times y le roban audiencia". Esta acción legal destaca una creciente preocupación por el uso de material con derechos de autor en el desarrollo de herramientas de inteligencia artificial. El resultado de la demanda podría influir en el futuro panorama del contenido digital y los derechos de propiedad intelectual si obtiene apoyo en el tribunal.

"OpenAI y Microsoft han construido un negocio valorado en decenas de miles de millones de dólares al tomar las obras combinadas de la humanidad sin permiso", dice The New York Times. "Al entrenar sus modelos, los demandados reprodujeron material con derechos de autor para explotar precisamente lo que la Ley de Derechos de Autor fue diseñada para proteger: los elementos de expresión protegibles dentro de ellos, como el estilo, la elección de palabras y la disposición y presentación de los hechos", cita la demanda.

Los modelos de lenguaje grandes o Large Language Models (LLMs) como ChatGPT de OpenAI están en el centro de esta controversia. Los LLMs se entrenan utilizando conjuntos de datos vastos, que incluyen textos de libros, sitios web y artículos, para comprender y generar lenguaje de manera similar a los humanos. No retienen artículos o datos específicos. En cambio, los utilizan para aprender patrones y estructuras de información. Este entrenamiento les permite producir contenido en diversos temas y estilos, ingresando a dominios tradicionalmente reservados para expertos humanos.

Sin embargo, The New York Times argumenta que OpenAI prestó especial atención a sus artículos al dar forma a la personalidad de su modelo. "Si bien los demandados se dedicaron a copiar a gran escala de muchas fuentes, dieron especial énfasis al contenido de Times al construir sus LLM, lo que revela una preferencia que reconoce el valor de esas obras", dijeron.

Considerando los millones de piezas de medios en los que se entrenó el LLM de OpenAI, no es sorprendente que este no sea el primer desafío legal para OpenAI o la comunidad más amplia de IA generativa.

Recientemente, un grupo de reconocidos autores, incluidos los ganadores del Premio Pulitzer Taylor Branch, Stacy Schiff y Kai Bird, representados por Julian Sancton, presentaron una demanda contra OpenAI por acusaciones similares de utilizar sus obras sin permiso. Esta demanda subraya una tendencia creciente de creadores y profesionales que se oponen al acceso ilimitado de la IA a su propiedad intelectual.

El valor de la originalidad

El panorama de la IA generativa no se limita solo al texto. Los avances en el arte de la IA han generado controversias, con varios litigios que desafían las implicaciones de derechos de autor de las obras de arte generadas por IA en campos como el cine, la música y la ilustración.

Sin embargo, algunos de estos casos han sido desestimados, lo que indica una comprensión legal compleja y en evolución de las capacidades creativas de la IA y su relación con las leyes de derechos de autor existentes.

La demanda del New York Times es particularmente significativa, ya que representa la primera gran organización de medios de comunicación que desafía directamente a los gigantes tecnológicos por el presunto uso no autorizado de su contenido. La demanda no especifica una suma monetaria, pero sugiere que la infracción ha causado daños sustanciales, lo que justifica una compensación significativa y medidas correctivas.

"Sin el amplio corpus de material con derechos de autor para alimentarse, no habría ChatGPT", afirma la demanda. "El éxito comercial de los demandados fue posible solo porque copiaron y digirieron la expresión protegida y susceptible de derechos de autor contenida en miles de millones de páginas de texto real, en millones de obras con derechos de autor, todo sin pagar un centavo a los autores y titulares de derechos".

Las implicaciones más amplias de esta demanda se extienden a cómo las empresas de IA podrían seguir accediendo y utilizando contenido existente. El desafío legal del New York Times a OpenAI y Microsoft sienta las bases para una conversación más amplia sobre la intersección de la tecnología, la ley y los derechos creativos. La demanda subraya las preocupaciones de los creadores de contenido con respecto a las amenazas de la competencia impulsada por la IA.

"Si The Times y otras organizaciones de noticias no pueden producir y proteger su periodismo independiente, habrá un vacío que ninguna computadora o inteligencia artificial podrá llenar", argumenta The Times en su demanda, "se producirá menos periodismo y el costo para la sociedad será enorme". Para Times, esto significa menos periodistas, mientras que para otros, esto significa el fin de una sociedad laboral tal como la conocemos.

Editado por Stacy Elliott.

Get crypto news straight to your inbox--

sign up for the Decrypt Daily below. (It’s free).

Noticias recomendados