Brief IA : Encyclopædia Britannica attaque OpenAI : ChatGPT accusé de plagiat

Encyclopædia Britannica attaque OpenAI : ChatGPT accusé de plagiat

Brief IA
Tom Levy·2 min·4 vues

Encyclopædia Britannica et Merriam-Webster poursuivent OpenAI pour utilisation non autorisée de leur contenu protégé, accusant l'entreprise d'avoir 'mémorisé' une grande partie de leur contenu avec GPT-4. Cette affaire soulève des questions cruciales sur les droits d'auteur et l'utilisation des données pour entraîner des modèles d'IA, et pourrait redéfinir les limites de l'utilisation des contenus protégés par des IA génératives.

En bref
1Encyclopædia Britannica et Merriam-Webster accusent OpenAI d'avoir utilisé leur contenu protégé pour entraîner ChatGPT.
2Britannica affirme que GPT-4 reproduit des passages entiers de son contenu sans autorisation, nuisant à son trafic web.
3Cette affaire s'inscrit dans une série de poursuites similaires contre des entreprises d'IA pour violation de droits d'auteur.
💡Pourquoi c'est importantCes poursuites soulignent les tensions croissantes entre éditeurs traditionnels et entreprises d'IA sur l'utilisation des contenus protégés.
Le brief IA que lisent les pros

L’IA et sa régulation t’intéressent ?

Lois, cadres et décisions qui façonnent l’IA, décryptés en français. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

Britannica et Merriam-Webster en guerre contre OpenAI

Encyclopædia Britannica et l'éditeur de dictionnaires Merriam-Webster ont engagé une action en justice contre OpenAI. Ils accusent l'entreprise d'avoir utilisé leur contenu protégé par des droits d'auteur pour entraîner son modèle d'intelligence artificielle, ChatGPT, et de générer des réponses qui sont "substantiellement similaires" à leur contenu original.

Selon les plaignants, OpenAI aurait copié à plusieurs reprises le contenu de Britannica sans obtenir l'autorisation préalable. Ils affirment que GPT-4, l'un des modèles d'OpenAI, a "mémorisé" une grande partie du contenu protégé et est capable de produire des copies presque identiques de portions significatives de leurs textes sur demande.

Des exemples troublants de similitudes

La plainte déposée par Britannica inclut des exemples concrets où les réponses générées par les modèles d'OpenAI sont mises en parallèle avec le texte original de Britannica. Dans ces exemples, des passages entiers semblent correspondre mot pour mot, ce qui soulève des questions sur l'utilisation non autorisée de ces contenus.

Britannica soutient également que cette pratique a "cannibalisé" son trafic web. En effet, au lieu de diriger les utilisateurs vers le site de Britannica, les réponses générées par ChatGPT substituent ou concurrencent directement le contenu de l'encyclopédie, ce qui n'est pas le cas avec un moteur de recherche traditionnel.

Un contexte de litiges croissants

Cette affaire s'inscrit dans une tendance plus large de poursuites en matière de droits d'auteur contre des entreprises d'intelligence artificielle. Le New York Times a également déposé une plainte similaire contre OpenAI, accusant l'entreprise d'avoir copié d'importantes quantités de son contenu protégé. En septembre, Anthropic a réglé une action collective pour avoir utilisé des livres protégés par des droits d'auteur pour entraîner ses modèles, ce qui a entraîné un paiement de 1,5 milliard de dollars aux auteurs concernés.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires