Por Jason Nelson
3 min lectura
Anthropic ha acusado a tres laboratorios chinos de IA de extraer millones de respuestas de su chatbot Claude para entrenar sistemas competidores, una medida que la empresa afirma viola sus términos de servicio y debilita los controles de exportación de EE. UU.
En una publicación de blog publicada el lunes, Anthropic dijo que identificó "campañas a escala industrial" por parte de los desarrolladores de IA DeepSeek, Moonshot y MiniMax para extraer las capacidades de Claude mediante destilación de modelos. La empresa alegó que los laboratorios generaron más de 16 millones de intercambios utilizando aproximadamente 24.000 cuentas fraudulentas.
El anuncio de Anthropic generó escepticismo y burlas en X, donde los críticos cuestionaron su postura dado cómo se entrenan los principales modelos de IA, incluido Claude, lo que refleja el debate más amplio y continuo sobre propiedad intelectual, derechos de autor y uso justo.
"Entrenaste con el internet abierto y luego lo llamas 'ataques de destilación' cuando otros aprenden de ti", escribió Tory Green, cofundadora de la empresa de infraestructura de IA IO.Net. "Los laboratorios que les gusta predicar 'investigación abierta' de repente llorando por el acceso abierto."
"¡Ohhh nooo, no mi IP privada, cómo se atreven a usar eso para entrenar un modelo de IA, solo Anthropic tiene el derecho de usar la IP de todos los demás, noooo, esto no puede tolerarse!", escribió otro usuario de X.
La destilación es un método de entrenamiento de IA en el que un modelo más pequeño aprende de las salidas de uno más grande.
En contextos de ciberseguridad, también puede describir ataques de extracción de modelos, donde un atacante utiliza acceso legítimo para consultar sistemáticamente un sistema y usar sus respuestas para entrenar un modelo competidor.
"Estas campañas están creciendo en intensidad y sofisticación", escribió Anthropic el lunes. "La ventana para actuar es estrecha, y la amenaza se extiende más allá de cualquier empresa o región. Abordarla requerirá una acción rápida y coordinada entre la industria, los legisladores y la comunidad global de IA."
"La destilación puede ser legítima: los laboratorios de IA la usan para crear modelos más pequeños y económicos para sus clientes", escribió Anthropic en una publicación separada en X. "Pero los laboratorios extranjeros que destilan ilícitamente modelos estadounidenses pueden eliminar salvaguardas, introduciendo capacidades de los modelos en sus propios sistemas militares, de inteligencia y vigilancia."
En junio, Reddit demandó a Anthropic, acusándola de extraer más de 100.000 publicaciones y comentarios y usar los datos para ajustar Claude.
El caso se suma a las demandas contra OpenAI, Meta y Google por el scraping a gran escala de contenido en línea sin permiso.
"[Existe] la cara pública que intenta ganarse la conciencia del consumidor con afirmaciones de rectitud y respeto por los límites y la ley, y la cara privada que ignora cualquier regla que interfiera con sus intentos de seguir llenándose los bolsillos", dijo la demanda de Reddit.
Anthropic dijo que está ampliando la detección, reforzando la verificación de cuentas, compartiendo inteligencia con otros laboratorios y autoridades, y añadiendo salvaguardas para limitar futuros intentos de destilación.
"Pero ninguna empresa puede resolver esto sola", escribió Anthropic. "Como señalamos anteriormente, los ataques de destilación a esta escala requieren una respuesta coordinada entre la industria de IA, los proveedores de nube y los legisladores."
Decrypt-a-cookie
This website or its third-party tools use cookies. Cookie policy By clicking the accept button, you agree to the use of cookies.