La détection des textes générés par l’IA, une bataille perdue d’avance ?
Il aura fallu du temps, mais OpenAI sait désormais reconnaître les images générées par ses modèles. En mai dernier, la firme a déployé publiquement un outil en ligne capable de détecter si un visuel a été créé à l’aide de ChatGPT ou de son API, en croisant les métadonnées C2PA et le filigrane invisible SynthID développé par Google DeepMind. Cependant, cette avancée soulève une question persistante : pourquoi, plus de trois ans après l’émergence de ChatGPT, la détection des textes générés par IA n’a-t-elle pas progressé de manière similaire ?
Les tentatives avortées d’OpenAI
OpenAI, en tant que pionnier, a tenté à plusieurs reprises de mettre en place des systèmes de détection. En août 2024, le Wall Street Journal a révélé qu’OpenAI avait développé un système de watermarking textuel, « invisible à l’œil nu », permettant de déterminer si un texte avait été généré par ses modèles de langage. Cet outil affichait un taux de réussite de 99,9 % selon des documents internes. Toutefois, il n’a jamais été déployé à grande échelle, en raison de préoccupations liées à la transparence et à l’impact potentiel sur l’utilisation de leurs services.
Un précédent outil, l’AI Text Classifier, lancé en janvier 2023, avait pour mission d’évaluer la probabilité qu’un texte soit généré par IA. Cependant, il a été désactivé six mois plus tard après avoir été critiqué pour sa faible précision, n’identifiant correctement que 26 % des textes générés par IA tout en classant à tort 9 % des textes humains comme étant d’origine IA.
Un filigrane universel qui ne l’est pas encore
Google a également investi dans ce domaine avec le développement de SynthID, un filigrane invisible initialement destiné aux images, mais élargi aux contenus textuels, audio et vidéo. Bien que Google ait annoncé un outil de détection lors de la conférence Google I/O 2025, celui-ci reste limité aux contenus générés par ses propres modèles. Cela crée une fragmentation dans les outils disponibles, rendant difficile la vérification de l’origine des contenus.
Un marché né dans l’urgence
L’absence de solutions robustes a ouvert la voie à de nouveaux outils de détection, tels que GPTZero, qui a attiré rapidement l’attention après son lancement en janvier 2023. En un an, GPTZero a atteint 4 millions d’utilisateurs et est devenu rentable. D’autres solutions, comme Lucide AI, ont également émergé, chacune développant des méthodes variées pour analyser la structure des phrases et la fréquence des mots.
Un indicateur, jamais une certitude
Aucune de ces solutions ne garantit une fiabilité absolue. Les faux positifs demeurent un problème, et les techniques de contournement rendent l’analyse encore plus complexe. Par exemple, un score inférieur à 25 % est considéré comme suspect, tandis qu’un score supérieur à 75 % indique probablement une rédaction humaine, mais cela n’exclut pas l’utilisation d’IA.
Le web indexe et valorise sans distinguer l’homme de la machine
À l’heure actuelle, le marché de la détection semble trop restreint pour attirer un intérêt commercial significatif de la part des grands acteurs. Les algorithmes privilégient la réaction humaine au contenu, qu’il soit généré par IA ou non. Une étude menée par Ahrefs en juillet 2025 indique que la majorité des pages les mieux classées sur Google auraient été rédigées avec l’aide de l’IA.
Dans ce contexte, la lutte pour distinguer les contenus générés par l’IA de ceux rédigés par des humains demeure un défi complexe, et la question de la provenance des contenus reste ouverte.
Source : Wall Street Journal, Blog du Modérateur
