Sur Wikipédia, des traductions assistées par IA sèment des erreurs dans plusieurs articles

⚡ Résumé en français par Brief IA
L'utilisation croissante d'outils d'intelligence artificielle pour traduire des articles sur Wikipédia soulève des préoccupations quant à la qualité et à la précision des informations. Des erreurs ont été identifiées dans plusieurs traductions, mettant en lumière les limites de ces technologies dans un contexte collaboratif. Cette situation appelle à une réflexion sur l'intégration de l'IA dans les processus de création de contenu en ligne.
📄 Article traduit en français
Sur Wikipédia, des traductions assistées par IA sèment des erreurs dans plusieurs articles
Intelligence artificielle
Wikipédia est aujourd’hui l’une des principales sources de connaissance en ligne, et son modèle collaboratif permet à des milliers de bénévoles de contribuer à l’enrichissement des articles, souvent traduits dans de nombreuses langues pour toucher un public mondial.
Néanmoins, l’arrivée des outils d’IA dans ce processus suscite de nouvelles interrogations. Récemment, plusieurs éditeurs de l’encyclopédie en ligne ont identifié des anomalies dans des articles traduits automatiquement par des modèles d’IA. Certaines traductions contenaient des citations erronées, des phrases sans source ou même des passages basés sur des documents totalement sans lien avec le sujet.
Des « hallucinations » générées lors des traductions
Le problème a été identifié par des contributeurs de Wikipédia lors de simples vérifications. Ils ont constaté que certaines traductions ajoutaient des erreurs absentes des articles d’origine. Dans plusieurs cas, les références bibliographiques étaient interverties ou pointaient vers des pages qui ne mentionnaient pas le sujet traité.
Parmi les exemples, on peut mentionner un article consacré à la famille noble française « La Bourdonnaye », où la traduction indiquait une page précise d’un ouvrage censé expliquer l’origine de la famille. Après vérification, cette page ne mentionnait pourtant pas la famille en question.
D’autres articles présentaient également des phrases ajoutées sans source ou des paragraphes provenant de documents sans rapport avec le sujet. Ce type d’erreur correspond à ce que l’on appelle des « hallucinations », un phénomène bien connu qui concerne même les IA les plus avancées selon cette étude.
Un projet de traduction basé sur des modèles d’IA
D’après 404Media, ces traductions provenaient d’un projet mené par l’organisation à but non lucratif Open Knowledge Association. L’initiative vise à améliorer la diversité linguistique de Wikipédia, notamment en finançant des traducteurs chargés d’adapter des articles dans différentes langues.
Pour accélérer la production, ces traducteurs utilisent des modèles de langage comme ChatGPT ou Gemini, et les instructions consistaient à copier certaines sections d’un article dans un modèle d’IA, puis à ajuster la traduction avant publication.
Notons que le projet utilisait auparavant Grok, avant de privilégier d’autres outils jugés plus fiables. Malheureusement, malgré ces précautions, plusieurs traductions ont ajouté des erreurs factuelles ou des références incorrectes.
Selon les informations publiées, les traducteurs reçoivent une rémunération d’environ 400 dollars par mois pour un travail pouvant atteindre 40 heures hebdomadaires. Ainsi, ce modèle a également suscité des débats au sein de la communauté, certains estimant qu’il pourrait encourager une production rapide au détriment de la vérification.
Wikipédia renforce ses règles de contrôle
Face à ces problèmes, les éditeurs de Wikipédia ont décidé d’introduire de nouvelles restrictions. Les traducteurs liés à ce programme peuvent désormais être bannis après plusieurs erreurs documentées, et leurs contributions supprimées si aucun éditeur expérimenté ne valide le contenu.
Pour limiter les dérives, l’organisation à l’origine du projet affirme avoir renforcé ses procédures, et parmi les mesures envisagées, une étape supplémentaire consiste à utiliser un second modèle d’IA pour comparer la traduction avec l’article d’origine et détecter d’éventuelles incohérences.
Brief IA — Veille IA en français
Toutes les innovations mondiales en IA, traduites et résumées automatiquement. Recevoir les meilleures actus IA chaque jour.