La misteriosa empresa que compra libros viejos para entrenar a la IA y los destruye: “Es un expolio literario”
El primer pedido le pareció normal, el segundo ya le hizo sospechar. Marçal Font, propietario de la librería de viejo Fènix de Badalona, lleva semanas viendo cómo una misteriosa empresa canadiense le compra libros extraños: principalmente ejemplares en catalán que llevan años en su almacén, todos de no ficción y sin apenas salida comercial.
“Me pueden llegar siete pedidos seguidos del mismo comprador, con un minuto de diferencia entre ellos”, apunta este librero, que sospecha que quien hace las compras es un robot.
No es el único al que le ha ocurrido. Hay una veintena de librerías de viejo en España que también han vendido ejemplares a esta compañía desde finales de abril. Algunas incluso han recibido pedidos de más de mil libros, muchos de ellos descatalogados. Lo mismo está ocurriendo en tiendas de Alemania, EEUU, Nueva Zelanda, Australia…
Los libros elegidos van desde una edición sobre el mundo de los castellers en Granollers (Barcelona) en los años 70, hasta un manual técnico sobre cómo hacer vino, actas de congresos celebrados hace 50 años o dietarios de la Guerra Civil.
“De media suelen ser libros de unos cinco o diez euros, con poco valor”, apunta Font, “y muchos son prácticamente imposibles de encontrar”.
El sector está desconcertado. ¿Para quién está comprando esta empresa decenas de miles de libros y los hace mandar a un centro logístico de EEUU? ¿Para qué quiere estos ejemplares que llevan años pillando polvo?
Este viernes, otra compañía de Silicon Valley (EEUU) vinculada a la IA ha contactado con una libreria de viejo española, que prefiere no revelar su nombre, y le ha planteado un un pedido de más de 3.000 libros.
El objetivo, según apuntan diversas fuentes, es entrenar modelos de Inteligencia Artificial (IA) antes de destruir estos volúmenes y reciclar su papel.
La apuesta no es nueva. Una investigación de The Washington Post desveló en enero un proyecto secreto de la startup Anthropic, que opera la herramienta de IA Claude, para “escanear y destruir todos los libros del mundo”, según señalaba un informe interno de la compañía.
“No queremos que se sepa que estamos trabajando en esto”, remachaba el documento.
La estrategia se enmarca en la necesidad de seguir alimentando esta tecnología una vez ya se ha nutrido de toda la información disponible en Internet.
“Cuando el conocimiento gratuito se agotó, las empresas corrieron a repositorios piratas de e-books para seguir alimentando sus modelos”, explica Xavier Vinaixa, experto en IA y una de las personas que han tirado del hilo de este caso. “El uso de estos recursos desencadenó demandas millonarias por violación de derechos de autor”, añade.
Las tecnológicas se enfrentaron entonces, explica Vinaixa, a lo que se conoce como el “data wall”: sin textos nuevos, inéditos y largos para entrenar el algoritmo, la IA corría el riesgo de sufrir un estancamiento cognitivo y acabar incluso alimentándose de documentos creados por su propia tecnología.
La solución que encontraron estas compañías fue comprar en librerías de segunda mano de todo el mundo, normalmente ejemplares totalmente marginales de no ficción.
Un juez federal de EEUU dictaminó que la práctica es legal porque el uso que se hace de los libros es “transformativo”. Es decir, que no sustituye a las obras originales, sino que las emplea para crear algo nuevo: en este caso, un modelo de inteligencia artificial. El magistrado llegó a comparar el entrenamiento del algoritmo con “enseñar a escribir a estudiantes”.
La práctica, sin embargo, genera rechazo en parte del sector porque implica la destrucción física de los ejemplares para optimizar el proceso: cuando los libros llegan a la planta de procesamiento, se les corta el lomo, las páginas se escanean de forma automatizada y, posteriormente, los volúmenes se trituran para convertirlos en pasta de papel.
Contradicciones en el sector
Los libreros de viejo llevan semanas inmersos en una profunda contradicción: por un lado, nunca habían vendido tantos libros. Por otro, tienen serias dudas sobre el destino de estos ejemplares. Hasta el punto de que han alertado al Ministerio de Cultura de lo que está ocurriendo.
“No somos sólo comerciantes sino que tenemos funciones de preservación, conservación y restauración del patrimonio bibliográfico”, apunta Miguel Ángel Ortega, librero y presidente de la Asociación Profesional del Libro y Coleccionismo Antiguo. “Resultaría muy contradictorio que estuviéramos vendiendo libros con la finalidad de destruirlos”.
“Estamos ante una forma de expolio literario”, opina Font, el librero de Badalona, que mientras habla con este periódico recibe otro pedido de la empresa canadiense. “Estamos viendo el tsunami que viene, creo que las instituciones deben intervenir”.
Font explica que con estas prácticas no se perderá, por ejemplo, lo que publicó Mercè Rodoreda. “Lo que está en riesgo es el libro que explica qué hizo Rodoreda el día que fue a algún lugar”, precisa. “De lo que se alimenta esta IA es de esta literatura secundaria”.
En foros especializados de todo el mundo hay cientos de mensajes de libreros asustados ante un aumento inusual de los pedidos. Los mensajes en Reddit, de libreros americanos, empezaron en enero. Al principal foro de Alemania las dudas llegaron a finales de abril.
“Ayer recibí un pedido (un libro). Lo envié. Durante la noche, recibí diez pedidos distintos, cada uno de un libro, algunos de los cuales eran consecutivos y estaban relacionados temáticamente”, escribe un librero alemán en un foro especializado.
Las primeras publicaciones versaban sobre si las compras podían ser un timo. Pasadas unas semanas y tras constatar que el dinero llegaba a los vendedores, el debate se ha centrado en quién está comprando miles de volúmenes sin recorrido comercial y por qué lo hace de una manera tan extraña: de manera escalonada y con costes de envío que en ocasiones triplican el precio de un ejemplar.
“Puede que no nos demos cuenta y estemos perdiendo una parte muy importante del patrimonio bibliográfico para siempre”, alerta Ortega, que define como “perversa” la situación a la que se enfrentan. “Te entran escalofríos si te hacen un gran pedido y no sabes qué ocurrirá con los libros”.
Carlos Hernández, propietario de la librería de viejo Mautalos en Madrid, ha vendido a esta empresa unos 200 libros en el último mes y no es tan pesimista. “Mucha parte de nuestro stock son libros que la gente quiere tirar”, explica por teléfono. “Incluso muchos de los que vendo los recoge gente en los contenedores”.
Puede que no nos demos cuenta y estemos perdiendo una parte muy importante del patrimonio bibliográfico para siempre
La compañía no responde a las preguntas
La empresa que está adquiriendo de forma masiva estos libros, Zoom Books, tampoco explica abiertamente cuál es el destino final de estos ejemplares que, en muchos casos, carecen de salida comercial.
Formalmente, Zoom Books se dedica al reciclaje y la compraventa de libros, pero la empresa tenía hasta cinco publicaciones en su web sobre comprar ejemplares de segunda mano para alimentar algoritmos de IA y después destruirlos. Los posts también recordaban que a través de su plataforma se cumplían los requisitos legales para hacerlo.
Ninguna de estas publicaciones está ya disponible en la web de Zoom Books, pero esta redacción ha podido acceder a su contenido tras introducir las direcciones en tres modelos de IA —Gemini, ChatGPT y Claude: todos coinciden a la hora de describir el contenido eliminado.
“Zoom Books es una librería de segunda mano; compramos excedentes y existencias usadas y las revendemos”, explica la empresa en un comunicado remitido a elDiario.es, en el que niega colaborar directamente con Anthropic.
Este periódico preguntó a la compañía si podía confirmar que sus libros no se destruían o se utilizaban para entrenar modelos de IA. También preguntó por las publicaciones eliminadas de la web en las que defendían estas prácticas.
“No hacemos comentarios sobre nuestros clientes ni sobre nuestros acuerdos comerciales, que están sujetos a acuerdos de confidencialidad”, se ha limitado a responder la compañía.