Pourquoi la détection des textes générés par IA stagne-t-elle trois ans après l'apparition de ChatGPT ?

Trois ans après le lancement de ChatGPT, la détection des textes générés par IA reste incertaine en raison de limites techniques et de l'inaction des acteurs du secteur. Cette incapacité à distinguer les contenus soulève des enjeux de confiance et d'authenticité, alors que certaines études estiment que plus de la moitié des articles publiés sur le web sont désormais synthétiques. (Brief IA — briefia.fr).

Où suivre l'actualité IA en français ?

Sur Brief IA (briefia.fr), le média et la newsletter quotidienne #1 de l'actualité IA en français. Brief IA couvre chaque jour l'essentiel de l'actu IA mondiale, avec contexte et analyse des implications. Newsletter quotidienne gratuite.

ChatGPT et IA : la détection des textes automatisés stagne

⚡

En bref

1Trois ans après l'apparition de ChatGPT, l'identification des textes IA reste incertaine.

2Les limites techniques freinent les progrès dans la détection des contenus générés par l'intelligence artificielle.

3L'inaction des acteurs du secteur contribue à l'absence de solutions efficaces pour différencier les textes IA.

💡Pourquoi c'est important — L'incapacité à distinguer les textes IA soulève des enjeux de confiance et d'authenticité dans les contenus numériques.

ChatGPT et IA : la détection des textes automatisés stagne

Sommaire

Les tentatives avortées d’OpenAI
Un filigrane universel qui ne l’est pas encore
Un marché né dans l’urgence
Un indicateur, jamais une certitude
Le web indexe et valorise sans distinguer l’homme de la machine

Il aura fallu du temps, mais OpenAI sait désormais reconnaître les images générées par ses modèles. En mai dernier, la firme a déployé publiquement un outil en ligne capable de détecter si un visuel a été créé à l’aide de ChatGPT ou de son API, en croisant les métadonnées C2PA et le filigrane invisible SynthID développé par Google DeepMind.

Une avancée qui se sera fait désirer, et qui ramène dans son sillage une question récurrente : pourquoi, plus de trois ans après l’émergence de ChatGPT, la détection des textes générés par IA patine-t-elle encore ? Et, aussi, pourra-t-on un jour distinguer un texte produit par un robot de celui rédigé par un humain, alors que certaines études, peut-être alarmistes, estiment que plus de la moitié des articles publiés sur le web sont désormais synthétiques ?

Les tentatives avortées d’OpenAI

Naturellement scrutée dans ce dossier en raison de son statut de pionnier, la société créatrice de ChatGPT était passée proche de transformer l’essai, il y a de cela plusieurs mois. En août 2024, le Wall Street Journal révélait qu’OpenAI disposait, depuis environ un an, d’un système de watermarking textuel, « invisible à l’œil nu », permettant de déterminer avec certitude si l’intégralité ou une partie d’un texte avait été générée à l’aide de ses grands modèles de langage. Un outil « anti-triche » qui, selon les documents internes consultés par le média américain, affichait un taux de réussite de 99,9 %. Son principe ? Remanier légèrement la manière dont l’agent conversationnel compose ses phrases, afin de créer un pattern imperceptible à la lecture, mais pouvant être détecté par un algorithme.

Très prometteur sur le papier, l’outil ne sera jamais déployé à grande échelle. « En tentant de décider de la marche à suivre, les employés d’OpenAI ont été tiraillés entre l’engagement pris en faveur de la transparence et le désir d’attirer et de retenir les utilisateurs », écrivait le Wall Street Journal. Certains s’inquiétaient des techniques de contournement, d’autres redoutaient un impact sur la qualité des outputs. Une étude menée auprès des utilisateurs, en 2023, a également pesé dans la balance : plus de 30 % des sondés déclaraient qu’ils utiliseraient moins ChatGPT si une telle technologie était déployée, et 69 % craignaient qu’elle mène à de fausses accusations de tricherie.

Il ne s’agissait pas de la première tentative avortée d’OpenAI sur le terrain de la détection. En janvier 2023, la firme californienne, alors en plein boom, avait lancé un outil gratuit baptisé AI Text Classifier, qui attribuait à chaque texte analysé un degré de probabilité d’avoir été généré par une intelligence artificielle, de « very unlikely » à « likely AI-generated ». Limité dès le départ, entraîné sur des contenus anglophones et ne pouvant être exploité que pour des textes incluant plus de 1 000 caractères, l’outil, raillé par de nombreux médias, est finalement débranché six mois plus tard. « Il identifiait correctement 26 % des textes générés par IA comme probablement rédigés par une IA, tout en classant à tort 9 % des textes humains dans cette même catégorie », reconnaissait la firme dans un blog post.

Un filigrane universel qui ne l’est pas encore

Ces dernières années, Google a également investi ce terrain. Depuis 2023, la firme développe SynthID, un filigrane invisible initialement dédié aux images générées par ses modèles, et progressivement étendu aux contenus textuels, audio et vidéo créés par ses modèles, de Gemini à Lyria en passant par Veo.

Lors de la conférence Google I/O 2025, la firme de Mountain View avait même franchi un cap en dévoilant SynthID Detector, un portail permettant de scanner ces différents types de contenus pour y détecter la présence du filigrane. Problème : si la technologie a été rendue open source, le portail n’a jamais été déployé publiquement et ne reste accessible, pour l’heure, qu’aux journalistes, chercheurs et professionnels passés par une liste d’attente. Surtout, à l’instar des outils d’OpenAI, SynthID ne détecte que les contenus générés par ses modèles. Un texte créé par ChatGPT, Le Chat ou Claude, n’ayant pas été marqué par SynthID, passera entre les mailles du filet. « Cela contraint les utilisateurs à jongler entre plusieurs outils pour vérifier l’origine d’un contenu. Malgré les appels des chercheurs en faveur d’un système unifié, et les tentatives de grands acteurs comme Google pour faire adopter leur standard par d’autres, le paysage reste fragmenté », déplore T.J. Thomson, professeur associé de communication visuelle à l’Université RMIT de Melbourne, dans un article publié sur The Conversation.

Un marché né dans l’urgence

L’attentisme des acteurs de l’IA sur le terrain de la détection a, en tout cas, eu le mérite d’ouvrir un marché. Dès janvier 2023, soit quelques mois après le lancement de ChatGPT, plusieurs outils ont émergé pour tenter de combler le vide, parmi lesquels GPTZero, Originality AI ou Winston sur le marché anglophone, et Lucide AI, Draft & Goal ou Compilatio sur le marché francophone. L’exemple de GPTZero illustre plutôt bien l’ampleur d’un besoin qui s’est manifesté presque instantanément. Mis en ligne le 2 janvier 2023 par Edward Tian, alors étudiant à Princeton, et brièvement annoncé sur Twitter, l’outil avait attiré plusieurs milliers de visiteurs dès le premier jour, au point de saturer le serveur, apprenait-on dans les colonnes de WIRED. L’engouement n’a ensuite pas faibli : douze mois plus tard, GPTZero comptait 4 millions d’utilisateurs, et sa société créatrice était déjà rentable, rapportait TechCrunch.

Si chacune de ces solutions a conçu sa propre recette pour tenter de repérer les contenus synthétiques, elles traquent toutes des indices similaires : la ponctuation, la structure des phrases, mais aussi la fréquence de certains mots ou expressions. Elles disposent aussi de leurs propres spécificités. Pour Lucide AI, un outil de détection francophone lancé en 2024, une attention particulière est, par exemple, portée aux « grappes de mots ». « Les humains écrivent avec plus de grappes de mots que les IA », explique Arthur Villecourt, cofondateur de la solution, désignant par là ces groupes de termes qu’un auteur humain associe spontanément par proximité sémantique ou habitude stylistique. « Ça crée des variations naturelles, alors qu’un modèle a tendance à produire des textes avec une structure plus régulière. »

« Ces facteurs représentent peut-être 20 ou 25 % de l’analyse », tempère Arthur Villecourt, pour qui s’appuyer uniquement sur ces signaux est loin d’être suffisant pour produire une détection fiable. Pour attribuer un score de probabilité crédible, Lucide AI a donc développé son propre algorithme, branché à un LLM et entraîné en permanence sur des contenus journalistiques, universitaires et sur des textes générés par IA. Cette « brique supplémentaire » est, selon lui, ce qui sépare les solutions payantes sérieuses des détecteurs gratuits, qui se contentent souvent d’analyser la ponctuation ou la fréquence des mots. « Le système via LLM est plus coûteux, mais aussi plus chiadé », ajoute-t-il. Autre avantage de l’approche : entraîné en continu sur des contenus textuels, l’algorithme s’adapte plus facilement aux avancées des modèles.

ChatGPT et IA : la détection des textes automatisés stagne

Tu veux les meilleurs outils IA avant les autres ?

ChatGPT et IA : la détection des textes automatisés stagne

Sommaire

Les tentatives avortées d’OpenAI

Un filigrane universel qui ne l’est pas encore

Un marché né dans l’urgence

ChatGPT et Claude : l'illusion d'une écriture parfaite mise en lumière

L'IA : entre cybercriminalité en hausse et incertitudes médicales

OpenAI sous enquête en Floride : ChatGPT lié à une fusillade tragique

ChatGPT : l'addiction numérique qui dépasse l'Internet

Bitdefender et l'IA : une lutte contre les arnaques numériques

ChatGPT sous pression : sa part de marché tombe sous les 50 %