Brief IA : The Atlantic dévoile les morceaux utilisés pour entraîner l'IA

The Atlantic dévoile les morceaux utilisés pour entraîner l'IA

Brief IA
Tom Levy·2 min·2 vues

The Atlantic a lancé AI Watchdog, un outil qui révèle les morceaux musicaux utilisés pour entraîner des IA, incluant des titres de Lady Gaga, Radiohead et Wu-Tang Clan. Alex Reisner a identifié quatre bases de données musicales, dont deux contiennent respectivement environ 12 millions et 9 millions de titres. Cette initiative soulève des questions sur les droits d'auteur et l'utilisation éthique des œuvres dans l'entraînement des IA.

En bref
1The Atlantic a lancé AI Watchdog, un outil révélant les morceaux musicaux utilisés pour entraîner des IA.
2Alex Reisner a découvert quatre bases de données musicales, dont deux contiennent des millions de titres.
3Les bases de données incluent des morceaux de Lady Gaga, Radiohead et Wu-Tang Clan, accessibles via AI Watchdog.
💡Pourquoi c'est importantCela soulève des questions sur les droits d'auteur et l'utilisation éthique des œuvres dans l'entraînement des IA.
Le brief IA que lisent les pros

Tu veux les meilleurs outils IA avant les autres ?

On teste et on décrypte les nouveaux outils IA chaque soir, en 5 min. Gratuit.

Inclus dès l'inscription : notre sélection des meilleurs guides & comparatifs IA.

Choisis ton rythme

Gratuit · Pas de spam · Désabonnement en 1 clic

📄
L'analyse en français

The Atlantic a récemment introduit un outil révolutionnaire qui permet de découvrir quels morceaux de musique ont été utilisés pour former certaines intelligences artificielles. Cet outil, baptisé AI Watchdog, offre un aperçu fascinant des vastes collections musicales qui ont servi à l'entraînement de ces technologies avancées.

Le journaliste Alex Reisner a joué un rôle clé dans cette initiative en mettant la main sur quatre immenses bases de données musicales. Ces bases de données, désormais accessibles au public via AI Watchdog, contiennent des informations précieuses sur les morceaux utilisés pour entraîner les modèles d'IA.

D’où proviennent ces données ?

Selon Reisner, deux de ces bases de données sont particulièrement colossales, contenant respectivement environ 12 millions et 9 millions de titres. Les deux autres, bien que plus modestes, dépassent tout de même les 100 000 chansons chacune. Ces ensembles de données ont été téléchargés des milliers de fois, et plusieurs d'entre eux proviennent de sources librement accessibles sur Internet.

Un exemple notable est le Free Music Archive, une plateforme qui permet l'écoute en streaming pour un usage personnel tout en exigeant une licence pour une utilisation commerciale. Cependant, l'entraînement d'une IA avec ces données ne se résume pas à un simple téléchargement. Reisner explique que trois des bases de données identifiées sont en fait des listes de liens vers des morceaux hébergés sur des plateformes comme YouTube ou Spotify.

Les développeurs exploitent ensuite des outils automatisés pour extraire les fichiers audio. Certains de ces outils contournent même les systèmes d'identification, les publicités, ou d'autres mécanismes censés rémunérer les artistes, ce qui va à l'encontre des règles établies par ces plateformes.

Que peut-on explorer sur AI Watchdog ?

En explorant ces bases de données, on découvre des artistes de renom tels que Lady Gaga, Fred again.., Radiohead, Aphex Twin, Wu-Tang Clan, et Bruce Springsteen. Même le compositeur expérimental Hainbach est inclus dans cette liste, illustrant la diversité des contenus utilisés pour nourrir les IA génératives.

AI Watchdog ne se limite pas à la musique. L'outil permet également d'explorer quelles chansons, livres et autres œuvres ont été utilisées pour entraîner des IA. Cependant, l'outil ne précise pas quelles entreprises ont exploité ces données. À ce jour, seules Google et Stability AI ont reconnu avoir utilisé certaines de ces œuvres dans leurs recherches.

Ainsi, cet outil suscite la curiosité de nombreux utilisateurs désireux de savoir quels contenus ont contribué à l'entraînement des modèles d'IA. Cette initiative soulève également des questions importantes sur les droits d'auteur et l'utilisation éthique des œuvres dans le domaine de l'intelligence artificielle.

Suivez Brief IA

L'actu IA du jour, aussi dans votre fil.

Commentaires