Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.
La portada de mañana
Acceder
Esperanza Aguirre, la ideóloga de un modelo sanitario que hace negocio
El PP usa el “sentido común” para disfrazar su renovado negacionismo climático
OPINIÓN | 'Privatizacionitis sanitaria: causas, síntomas, tratamiento', por Isaac Rosa

Nueva victoria legal para las empresas de IA: pueden usar obras protegidas para su entrenamiento sin permiso de los autores

Una librería, en una imagen de archivo

Carlos del Castillo

25 de junio de 2025 22:13 h

5

No es una victoria total, pero sí un importante precedente en para la gran batalla legal sobre copyright y el entrenamiento de las inteligencias artificiales. Dos tribunales federales estadounidenses acaban de dictaminar que incluir obras protegidas en las bases de datos de estos algoritmos es un uso legítimo, aunque sus autores estos no hayan dado permiso para que se usen con este fin.

No obstante, uno de los jueces responsables de esas decisiones ha ido más lejos que el otro a la hora de especificar cómo deberían haberse adquirido esas obras, ya que considera fundamental que las empresas de IA hayan pagado por ellas en primer lugar. Así lo ha dispuesto el juez William Alsup, del Distrito Norte de California, en un caso que implicaba a Anthropic, la tercera gran empresa en la carrera de la IA tras OpenAI y Google. Anthropic fue demandada el año pasado por tres escritores que la acusaron de incluir sus libros pirateados en el entrenamiento del modelo Claude sin consentimiento.

La compañía ha podido demostrar que realmente había comprado algunos de los libros en los que se basaba la demanda. Lo hizo en su formato físico, desencuadernándolos y escaneado sus páginas una a una e incluyéndolas en las bases de datos de Claude. Esta práctica, para el juez, constituye un “uso justo” de las obras, aunque Anthropic no recabara el visto bueno de sus autores previamente.

“Los autores sostienen que entrenar modelos de inteligencia artificial resultará en una explosión de obras que competirán con las suyas”, escribe el juez en su resolución, que les avisa que “esto no es así”. Es como “si se quejaran de que enseñar a los escolares a escribir bien resultaría en una explosión de obras competidoras”, argumenta el juez, que recuerda a los demandantes que los derechos de autor se basan en proteger la autoría de la obra, “no proteger a los autores de la competencia”.

“Como cualquier lector que aspira a ser escritor, los modelos de IA de Anthropic se entrenaron con obras no para adelantarse y replicarlas o suplantarlas, sino para dar un giro y crear algo diferente”, falla Alsup.

¿Y los libros descargados ilegalmente?

La victoria de Anthropic es trascendental porque abre la puerta a que las compañías de IA paguen simplemente por el precio de venta al público de las obras que quieran utilizar, sin necesidad de pagar más o negociar su uso con los autores. Sin embargo, la sentencia viene con un gran asterisco tanto para esta empresa (fundada por ex trabajadores de OpenAI y Google DeepMind y financiada con miles de millones de dólares por Amazon y la propia Google) en lo relativo a los libros descargados de internet ilegalmente.

Y no serían precisamente pocos. “Anthropic no tenía derecho a utilizar copias pirateadas para su biblioteca central”, avisa el juez: “Anthropic descargó más de siete millones de copias pirateadas de libros, no pagó nada y mantuvo estas copias pirateadas en su biblioteca incluso después de decidir que no las usaría para entrenar su IA. Los autores argumentan que Anthropic debería haber pagado por estas copias pirateadas. Esta resolución está de acuerdo”.

Los autores argumentan que Anthropic debería haber pagado por estas copias pirateadas. Esta resolución está de acuerdo

Alsup excluye claramente esta práctica del “uso justo” de las obras para el entrenamiento de Claude e indica a los demandantes que lo juzgará en una pieza separada, invitándoles a seguir el litigio por esa vía. Una decisión igualmente clave tanto para Anthropic como para las empresas de IA, puesto que las expone a multas milmillonarias en caso de que los juzgados terminen declarando que deben pagar el precio de cada obra utilizada.

Pagar por cada obra

En otra resolución conocida en la madrugada de este miércoles, otro juez federal ha tomado la misma decisión en la demanda que 13 autores interpusieron contra Meta por usar sus obras para el entrenamiento de su modelo LlaMa si su permiso. Según el tribunal, los escritores no han logrado demostrar cómo perjudica su posición en el mercado el hecho de que Meta haya incluido sus libros con derechos de autor en sus bases de datos.

Sin embargo, de nuevo, el juez no entra a valorar el hecho de que esos materiales se obtuvieran ilegalmente. Solo su empleo para el entrenamiento de los modelos, lo que también considera un “uso justo” dado que las respuestas de la inteligencia artificial basadas en esas obras son los suficientemente “transformadoras” respecto al contenido original de los libros.

El aspecto de la piratería en el caso de Meta es especialmente relevante, puesto que documentos internos de la multinacional han mostrado que descargó al menos 81,7 terabytes de libros ilegalmente de Internet para entrenar sus modelos. Aunque depende del formato de las obras, esa base de datos podría contener unos 40 millones de libros. El juez de su caso no ha entrado a valorar estos hechos como hace Alsup, pero ha citado a los demandantes y a los abogados de Meta a una reunión para discutir como manejar las reclamaciones por piratería y valorar su tratamiento en una pieza separada.

Según correos electrónicos de empleados de Mark Zuckerberg presentados ante el tribunal, la descarga se realizó mediante torrents y utilizando ordenadores de la empresa. Los propios trabajadores alertaron a la dirección de que era una práctica ilícita que podría traerles problemas, pero esta, supuestamente, habría seguido adelante con ella.

La evidencia presentada contra Meta es la más contundente, pero su competencia está enfrentando procesos similares. OpenAI, por ejemplo, reconoció que había descargado y transcrito millones de vídeos de YouTube para usar ese material para el entrenamiento de ChatGPT, algo que violaría los derechos de autor tanto de los creadores como de la plataforma. Esta última, no obstante, ha renunciado a demandar a OpenAI por el momento, quizá porque su matriz, Google, ha sido acusada de hacer lo mismo.

OpenAI sí ha reconocido que ha usado contenidos protegidos por copyright, defendiendo que entrenar inteligencias artificiales habría sido “imposible” sin ese material. No obstante, no ha aclarado si accedió legalmente a él. Será algo que también diluciden los tribunales, puesto que la compañía ha sido demandada por medios como The New York Times y The Intercept, junto con ocho publicaciones del grupo Alden Global, por utilizar “millones” de artículos protegidos sin autorización.

Esta no es la única demanda contra OpenAI. George R.R. Martin, el autor de Canción de hielo y fuego, junto con otros 16 reconocidos escritores respaldados por el sindicato Authors Guild, presentaron una demanda colectiva contra la compañía. Otros autores han tomado acciones similares por su cuenta. Estos casos siguen en curso, y OpenAI ha respondido afirmando que respeta los derechos de los autores y está en conversaciones con Authors Guild para encontrar soluciones.

La clave de todos estos casos será hasta dónde alcanza el “uso justo” de las obras. Un “uso justo” que el juez del caso Anthropic ha amparado para el entrenamiento de las inteligencias artificiales, pero no para el empleo de contenidos descargados ilegalmente para ello.

----

Esta información se ha actualizado el 26 de junio para incluir la resolución en el caso sobre Meta, aparecida tras la publicación original.

Etiquetas
stats