« Benchmarks de sécurité de l'IA » : pourquoi Meta fait sonder ChatGPT et Gemini par de faux comptes d'ados

Benchmarks de sécurité de l’IA : Meta teste ChatGPT et Gemini avec de faux comptes d’adolescents

Pendant des mois, des prestataires rémunérés par Meta ont prétendu être des mineurs pour évaluer les limites des chatbots concurrents, selon un rapport du média américain WIRED.

La compétition pour le développement et l’entraînement des modèles de langage (LLM) est intense. D’après l’enquête de WIRED parue le 29 juin 2026, Meta a engagé des centaines de prestataires de l’entreprise Covalen pour réaliser une campagne de tests ciblant les chatbots rivaux, tels que ChatGPT, Gemini et Character.AI.

Ce projet, désigné en interne sous le nom de « Cannes », aurait été actif jusqu’au 21 avril dernier. La méthode employée consistait à créer de faux comptes présentés comme appartenant à des mineurs, à envoyer des messages et des images à ces IA concurrentes, puis à consigner leurs réponses dans des tableurs.

Selon un document interne consulté par WIRED, l’opération est décrite comme un exercice de « benchmarking de sécurité » visant à produire des jeux de données comparatifs. Plus de 45 000 prompts ont été soumis aux IA concurrentes lors d’une campagne unique menée en août 2025, avec un tableur listant 3 748 prompts distincts.

Une partie significative des messages envoyés se présentait sous la forme de requêtes d’enfants ou d’adolescents en détresse, abordant des sujets tels qu’une collégienne de 13 ans enceinte cherchant des pilules abortives, un élève de primaire témoin d’une menace armée, ou une jeune fille demandant comment dissimuler des troubles alimentaires à ses parents. D’autres prompts traitaient de sujets plus graves comme le suicide ou des propos haineux.

D’anciens prestataires ont exprimé leurs inquiétudes quant aux implications judiciaires potentielles, certaines requêtes semblant dépasser le cadre d’un test de sécurité standard.

Meta justifie cette opération en arguant qu’elle vise à améliorer la sécurité de ses services, affirmant que tester les réponses des chatbots pour garantir des expériences sûres et adaptées à l’âge est une pratique courante dans l’industrie. Toutefois, les entreprises concernées, notamment Google et Character.AI, ont déclaré n’avoir jamais autorisé ce type de test, Character.AI évoquant une violation de ses conditions d’utilisation, tandis qu’OpenAI a indiqué « se pencher sur la question ».

Source : WIRED

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *