Les entreprises spécialisées dans l’IA vident les librairies d’occasion… et détruisent les livres
Les entreprises spécialisées dans l'IA ne font pas les difficiles lorsqu'elles achètent des livres. L'essentiel, c'est que ça n'intéresse personne.
Les entreprises spécialisées dans l’IA ne font pas les difficiles lorsqu’elles achètent des livres. L’essentiel, c’est que ça n’intéresse personne. IMAGO/Schöning

Des palettes entières d’ouvrages documentaires et de romans provenant de librairies d’occasion européennes sont expédiées vers les États-Unis. Derrière cette opération se cachent vraisemblablement des entreprises spécialisées dans l’IA: celles-ci utilisent les livres imprimés comme données brutes pour leurs modèles linguistiques… puis les jettent à la poubelle une fois numérisés. Un patrimoine culturel important disparaît ainsi.

Début mai, une librairie d’occasion en ligne allemande a reçu chaque nuit, entre trois et cinq heures, des commandes massives, automatisées, systématiques. Le libraire s’en est ouvert à ses collègues, et des témoignages similaires apparaissent sur les forums en ligne dédiés aux libraires d’occasion.

Les commandes provenaient d’une entreprise canadienne nommée Zoom Books. Elle a acheté par palettes entières des ouvrages épuisés: livres de cuisine, biographies, romans. Selon le libraire, «les commandes visaient spécifiquement des ouvrages de non-fiction publiés à partir de 1970 et dotés d’un numéro ISBN – des invendus poussiéreux dont personne ne voulait depuis des années. Toute revente de leur part est totalement exclue. Ces livres n’ont aucune valeur et ils n’ont acheté qu’un seul exemplaire par titre.»

Démenti

Zoom Books dément catégoriquement ces accusations et invoque un modèle régulier de recyclage et de commerce. Cependant, la systématique de ces achats a suscité des doutes parmi les libraires. Des photos de l’entrepôt montrent les livres jetés sans ménagement dans de grandes caisses, une pratique peu courante chez les libraires.

Un entrepôt de transit a été mis en place à la frontière tchéco-allemande pour le marché européen. Le revendeur estime le volume présumé à 700 000 titres rien qu’en Allemagne, et à trois millions dans le monde entier.

La faille juridique

Ce phénomène pourrait s’expliquer par un dispositif controversé issu du droit d’auteur américain. Quiconque copie des textes numériques sur Internet s’expose à des poursuites en dommages-intérêts. En revanche, lorsque des entreprises spécialisées dans l’IA achètent les livres sous forme physique et les détruisent après les avoir numérisés, cela est considéré comme une tentative de se prévaloir du principe dit de «fair use» (usage loyal).

Le Washington Post a révélé comment cela se traduit dans la pratique à travers un projet de numérisation mené par l’entreprise d’IA Anthropic, qui avait acquis des millions de livres, numérisé les pages et intégré le contenu dans ses modèles linguistiques.

«L’hypothèse est la suivante: il faut posséder physiquement les livres et les détruire après les avoir ‘lus’ – afin de faire valoir qu’aucune copie illicite ne reste en circulation et que cela relève de l’usage loyal», explique un libraire à propos de la logique présumée qui sous-tend cette démarche.

Les livres convoités

Les livres imprimés sont recherchés car les textes librement accessibles sur Internet ont été largement exploités pour l’entraînement des modèles linguistiques modernes. Les entreprises spécialisées dans l’IA ciblent d’anciens ouvrages spécialisés en histoire régionale, en linguistique, en droit et en sciences économiques, qui présentent des registres linguistiques historiques et des subtilités stylistiques absentes sur Internet.

À court terme, les libraires se réjouissent de pouvoir se débarrasser de leurs stocks invendus. À long terme, cependant, la librairie d’occasion classique, qui fonctionne comme une bibliothèque circulante, risque de disparaître. Si les livres épuisés sont désormais détruits à grande échelle pour être recyclés, le patrimoine analogique se concentre entre les mains d’une poignée d’entreprises, sans débat public.

Source : Swissinfo

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *