Brief IA : Meta accusé de plagiat par des éditeurs de livres

Meta accusé de plagiat par des éditeurs de livres

Brief IA
Tom Levy·3 min·9 vues

Meta est poursuivie par cinq grands éditeurs de livres, dont Macmillan et Hachette, ainsi qu'un auteur, Scott Turow, pour violation de droits d'auteur lors de l'entraînement de ses modèles d'IA Llama. Les plaignants allèguent que Meta a utilisé des œuvres protégées sans autorisation, en extrayant des contenus de sites de piratage notoires et en intégrant des copies non autorisées dans son modèle. Cette affaire pourrait redéfinir les limites de l'utilisation des contenus protégés par des droits d'auteur dans le développement de l'IA.

En bref
1Meta est poursuivi par cinq éditeurs et un auteur pour avoir utilisé illégalement leurs œuvres protégées pour entraîner ses IA.
2La plainte allègue que Meta a extrait des contenus protégés de sites de piratage pour alimenter ses modèles Llama.
3Un précédent jugement a reconnu l'usage équitable pour l'entraînement d'IA, mais des poursuites collectives continuent.
💡Pourquoi c'est importantCes poursuites pourraient redéfinir les limites légales de l'utilisation de contenus protégés pour l'entraînement des IA.
Le brief IA que lisent les pros

L’IA et sa régulation t’intéressent ?

Lois, cadres et décisions qui façonnent l’IA, décryptés en français. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Meta accusé de plagiat par des éditeurs de renom

Meta, le géant de la technologie, se retrouve au cœur d'une bataille judiciaire après qu'un groupe de cinq éditeurs de livres et un auteur ont déposé une plainte collective contre l'entreprise. Ces éditeurs, parmi lesquels figurent des noms prestigieux tels que Macmillan, McGraw Hill, Elsevier, Hachette, et Cengage, ainsi que l'auteur Scott Turow, accusent Meta d'avoir commis l'une des plus grandes violations de droits d'auteur de l'histoire. Selon eux, Meta aurait utilisé leurs livres et articles sans autorisation pour entraîner ses modèles d'intelligence artificielle, notamment Llama. Cette affaire a été rapportée plus tôt par le New York Times.

Des accusations de piratage pour entraîner l'IA

La plainte déposée par les éditeurs accuse Meta d'avoir sciemment extrait des œuvres protégées à partir de sites de piratage bien connus, tels que LibGen, Anna’s Archive, Sci-Hub, et Sci-Mag. Ces contenus auraient ensuite été intégrés dans le modèle d'IA de Meta. Les plaignants affirment également que le modèle Llama a été formé à partir du jeu de données Common Crawl, qui contiendrait de nombreuses copies non autorisées d'œuvres protégées. Cette méthode d'entraînement aurait permis à Llama de produire des textes très similaires, voire identiques, à ceux des œuvres originales.

Des exemples concrets de reproduction textuelle

Les éditeurs ont fourni des exemples précis pour étayer leurs accusations. Par exemple, lorsque Llama est sollicité avec quelques phrases tirées du manuel "Calculus: Early Transcendentals", 9ème édition, par James Stewart de Cengage, il reproduit mot à mot la suite du texte. Ce type de reproduction textuelle soulève des questions sur l'utilisation des œuvres protégées dans le développement des modèles d'IA.

Un précédent judiciaire et des poursuites similaires

Ce n'est pas la première fois que Meta est confronté à des accusations de violation de droits d'auteur. Dans un précédent procès, un juge fédéral avait statué en faveur de Meta, mais il avait souligné que cette décision ne signifiait pas que l'utilisation par Meta de matériaux protégés par des droits d'auteur pour entraîner ses modèles de langage était légale. Par ailleurs, un groupe d'auteurs a également poursuivi Anthropic pour des violations similaires des droits d'auteur. Bien qu'un juge ait considéré que l'entraînement sur des livres légalement acquis pouvait être un usage équitable, Anthropic a dû régler une action collective en versant 1,5 milliard de dollars aux auteurs concernés.

Les demandes des plaignants

Les éditeurs et Scott Turow demandent des dommages-intérêts à Meta et souhaitent que le tribunal ordonne à l'entreprise de cesser ses activités présumées illégales. Ils exigent également que Meta fournisse une liste complète des livres, articles de revues et autres œuvres protégées utilisées pour entraîner ses modèles d'IA Llama.

La position de Meta

Face à ces accusations, Meta se défend vigoureusement. Dave Arnold, porte-parole de l'entreprise, a déclaré que l'intelligence artificielle stimule des innovations significatives et que les tribunaux ont reconnu que l'entraînement de l'IA sur du matériel protégé peut être considéré comme un usage équitable. Meta prévoit de contester ce procès de manière agressive, affirmant que ses pratiques sont conformes aux lois en vigueur. Par ailleurs, des discussions internes chez Meta ont révélé des préoccupations sur la manière de gérer la couverture médiatique suggérant l'utilisation d'un jeu de données piraté.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires