Brief IA

Le dictionnaire poursuit OpenAI

⚖️ Régulation & Éthiquevia TechCrunch IA·Amanda Silberling·

Le dictionnaire poursuit OpenAI

Le dictionnaire poursuit OpenAI

Résumé en français par Brief IA

• Encyclopedia Britannica et Merriam-Webster accusent OpenAI d'avoir violé le droit d'auteur de près de 100 000 articles en les utilisant pour l'entraînement de modèles de langage. • Les plaignants cherchent à protéger leurs contenus et à obtenir des compensations financières. • Cette affaire soulève des questions cruciales sur l'utilisation des données protégées pour l'entraînement des intelligences artificielles et pourrait établir un précédent juridique. 💡 Pourquoi c'est important : cette poursuite pourrait redéfinir les limites de l'utilisation des contenus protégés dans le développement de l'IA.

📄 Article traduit en français

Le dictionnaire poursuit OpenAI

L'Encyclopedia Britannica et Merriam-Webster ont déposé une plainte contre OpenAI, alléguant que le géant de l'IA a commis une « violation massive des droits d'auteur ».

Britannica, qui possède Merriam-Webster, conserve les droits d'auteur sur près de 100 000 articles en ligne, qui auraient été extraits et utilisés pour entraîner les LLM d'OpenAI sans autorisation, selon l'éditeur dans sa plainte.

Britannica accuse également OpenAI de violer les lois sur les droits d'auteur lorsqu'il génère des résultats contenant des reproductions verbatim complètes ou partielles de son contenu et lorsque le laboratoire d'IA utilise ses articles dans le flux de travail RAG (génération augmentée par récupération) de ChatGPT. L'outil RAG d'OpenAI est la manière dont le LLM parcourt le web ou d'autres bases de données pour des informations nouvellement mises à jour lors de la réponse à une requête. Britannica allègue également qu'OpenAI viole le Lanham Act, une loi sur les marques, lorsqu'il génère des hallucinations fictives et les attribue faussement à l'éditeur.

La plainte indique : « ChatGPT prive les éditeurs web comme [Britannica] de revenus en générant des réponses aux requêtes des utilisateurs qui substituent et concurrencent directement le contenu des éditeurs comme [Britannica] ». Britannica soutient également que les hallucinations de ChatGPT mettent en péril « l'accès continu du public à des informations en ligne de haute qualité et fiables ».

Britannica rejoint un certain nombre d'autres éditeurs et écrivains dans leur action en justice contre OpenAI pour des problèmes de droits d'auteur. Le New York Times, Ziff Davis (propriétaire de Mashable, CNET, IGN, PC Mag, et d'autres), ainsi que plus d'une douzaine de journaux à travers les États-Unis et le Canada, y compris le Chicago Tribune, le Denver Post, le Sun-Sentinel, le Toronto Star et la Canadian Broadcasting Corporation, ont également poursuivi OpenAI.

Une plainte similaire de Britannica contre Perplexity est toujours en attente.

Il n'existe pas de précédent juridique solide établissant si l'utilisation de contenu protégé par des droits d'auteur pour entraîner un LLM constitue une violation des droits d'auteur ou non. Cependant, dans un cas particulier, Anthropic a réussi à convaincre le juge fédéral William Alsup que ce cas d'utilisation — utiliser le contenu comme données d'entraînement — est suffisamment transformateur pour être légal. Cependant, Alsup a soutenu qu'Anthropic avait violé la loi en téléchargeant illégalement des millions de livres, plutôt qu'en les payant, ce qui a entraîné un règlement de 1,5 milliard de dollars pour les écrivains concernés.

TwitterLinkedIn

Brief IA — Veille IA quotidienne

Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.