Un groupe d'éditeurs et d'auteurs majeurs affirme que Meta a piraté des millions de livres pour entraîner son IA Llama, intensifiant les batailles juridiques auxquelles est confrontée l'industrie de l'IA de plusieurs milliards de dollars.
Retour
Un groupe d'éditeurs et d'auteurs majeurs affirme que Meta a piraté des millions de livres pour entraîner son IA Llama, intensifiant les batailles juridiques auxquelles est confrontée l'industrie de l'IA de plusieurs milliards de dollars.

Cinq grands éditeurs et le romancier à succès Scott Turow ont déposé un recours collectif contre Meta Platforms Inc., alléguant que l'entreprise s'est livrée à une violation massive du droit d'auteur pour construire ses modèles d'intelligence artificielle Llama. La plainte, déposée devant un tribunal fédéral de Manhattan, soutient que les ambitions de Meta en matière d'IA, se chiffrant en milliards de dollars, reposent sur une base de livres et d'articles piratés, ce qui constitue une menace directe pour l'investissement massif de l'entreprise dans cette technologie.
« La violation à grande échelle de Meta n'est pas un progrès public, et l'IA ne sera jamais correctement réalisée si les entreprises technologiques privilégient les sites pirates par rapport à l'érudition et à l'imagination », a déclaré Maria Pallante, présidente de l'Association of American Publishers, dans un communiqué.
La plainte allègue que les ingénieurs de Meta ont utilisé des référentiels tels qu'Anna’s Archive — un moteur de recherche de contenus piratés — pour acquérir des œuvres sans licence afin d'entraîner Llama. Les plaignants, parmi lesquels Hachette, Macmillan et McGraw Hill, affirment que des millions d'œuvres protégées par le droit d'auteur ont été utilisées, allant des manuels scolaires aux romans comme « La Cinquième Saison » de N.K. Jemisin. Meta a contesté ces allégations, affirmant que l'entraînement de l'IA sur des contenus protégés peut être considéré comme un « usage équitable » (fair use) et qu'elle « combattra cette action en justice de manière agressive ».
Ce défi juridique intervient alors que Meta augmente considérablement son engagement financier dans l'IA, avec des dépenses d'investissement prévues pour l'année complète entre 125 et 145 milliards de dollars. La plainte réclame des dommages-intérêts non spécifiés, mais des affaires similaires soulignent le potentiel de sanctions financières massives. Dans une affaire distincte contre Databricks, un avocat spécialisé dans le droit d'auteur a noté que les dommages potentiels pourraient être « extraordinaires », atteignant jusqu'à 150 000 dollars par œuvre contrefaite, un chiffre qui pourrait « liquider tous les actifs » d'une entreprise.
L'affaire contre Meta est la dernière d'une série de batailles juridiques à enjeux élevés entre les entreprises technologiques et les détenteurs de droits d'auteur sur les données utilisées pour entraîner les grands modèles de langage. Des entreprises telles qu'OpenAI, Anthropic et Databricks ont toutes été confrontées à des plaintes similaires de la part d'auteurs, d'artistes et d'organisations de presse, créant un paysage juridique complexe et incertain pour l'industrie naissante de l'IA.
Les tribunaux n'ont pas encore formé de consensus sur la question de savoir si l'utilisation d'œuvres protégées pour l'entraînement de l'IA constitue un « usage équitable ». Cependant, les risques financiers deviennent de plus en plus clairs. Anthropic, soutenu par Amazon et Google, a récemment accepté de créer un fonds de 1,5 milliard de dollars pour indemniser les auteurs dans le cadre d'un règlement visant à résoudre un recours collectif pour piratage, marquant ce qui est considéré comme le premier grand règlement de ce type. Cela établit un précédent coûteux pour Meta alors qu'elle fait face à son propre combat juridique.
Le procès vise directement le cœur de la stratégie actuelle de Meta, qui consiste à dépenser des centaines de milliards de dollars dans l'infrastructure de l'IA. L'entreprise a récemment lancé une vente d'obligations allant jusqu'à 25 milliards de dollars pour aider à financer ces efforts, alors même que les investisseurs se sont inquiétés de l'absence de voie claire vers la monétisation. Le PDG Mark Zuckerberg a admis qu'il n'avait pas de « plan très précis » pour le déploiement des produits d'IA, une déclaration qui a contribué à une chute de 10 % du cours de l'action de l'entreprise après son dernier appel sur les résultats.
Si les tribunaux statuent contre Meta, l'entreprise pourrait être contrainte de payer des milliards de dommages-intérêts et, plus grave encore, pourrait devoir réentraîner ses modèles Llama sans les données contestées. Cela représenterait un revers important pour sa position concurrentielle face à des rivaux comme OpenAI et Google, et pourrait invalider une part substantielle de ses dépenses d'investissement massives dans l'IA. L'affaire souligne la tension croissante entre la poussée de l'industrie technologique pour un développement rapide de l'IA et les cadres juridiques et éthiques qui protègent la propriété intellectuelle.
Cet article est uniquement à titre informatif et ne constitue pas un conseil en investissement.