Comment l'IA peut co-construire un délire avec vous

Comment l’IA peut co-construire un délire avec vous

Trois psychiatres décrivent comment un agent conversationnel peut, sans le vouloir, transformer une idée bancale en certitude. Voici les trois comportements à repérer.

On a longtemps résumé les dérapages de l’IA à ses « hallucinations » : la machine invente une réponse fausse et l’humain qui ne cherche pas plus loin la croit. Un article de revue publié dans NPP-Digital Psychiatry and Neuroscience, appartenant à Nature, propose un autre cadre. Le problème ne serait pas que l’IA dit n’importe quoi, mais que, parfois, elle vous aide à bâtir un délire avec vous.

Le psychiatre Marc Augustin et ses coauteurs Thomas A. Pollak et Helen Morrin, rattachés au King’s College de Londres, ont relu la littérature existante sur les interactions IA-psychose. Leur conclusion : trois caractéristiques déjà connues des agents conversationnels peuvent se renforcer mutuellement chez des personnes vulnérables. Ils appellent ça la « spirale d’amplification ».

Les trois ingrédients de la spirale

Le premier comportement, c’est la sycophancy, ou complaisance : la tendance d’un chatbot à valider ce que dit l’utilisateur plutôt qu’à contredire une hypothèse douteuse. Si vous utilisez des chatbots propulsés par un LLM, vous avez forcément vécu ce « Oui, tu as parfaitement raison ! » si caractéristique.

Le deuxième, c’est l’alignement linguistique : l’IA copie peu à peu votre vocabulaire, votre ton, votre façon d’écrire, pour créer une connivence. C’est une des techniques de manipulation psychologiques les plus connues, utilisées aussi bien lors d’entretiens d’embauche que dans des négociations pour libérer des otages.

Le troisième, c’est l’hyperpersonnalisation : le modèle adapte ses réponses en piochant dans tout ce que vous lui avez confié lors des conversations précédentes. Ce biais est arrivé en même temps que la « mémoire » chez les différents LLM, qui vont, petit à petit vous connaître.

Pris séparément, ces traits rendent l’outil agréable et plus performant au quotidien. Le souci, selon les auteurs, c’est quand ils se nourrissent les uns les autres. Contrairement aux délires qui intégraient d’anciennes technologies, comme la télévision ou la radio, l’IA ne se contente pas d’être un décor passif : elle co-construit l’idée délirante, en continu, de manière personnalisée. Vous énoncez une croyance bizarre, l’agent l’approuve avec vos propres mots, puis y ajoute des détails tirés de votre historique. Et pour les personnes les plus fragiles, la boucle se referme.

Augustin et son équipe ne prétendent pas avoir découvert ces comportements : ils en proposent une lecture combinée. Le cadre et ses hypothèses réclament encore une validation par des études de cas et des recherches empiriques. Autrement dit, l’étude propose une grille de lecture sérieuse, mais manque encore de preuve sur le terrain.

L’intérêt du papier est pourtant énorme : en nommant la spirale comme un mécanisme unique, il donne aux développeurs quelque chose de concret, qu’ils peuvent ajuster en améliorant les modèles. Tant que la complaisance, la personnalisation et le mimétisme du langage sont traités comme trois « bugs » séparés, personne ne regarde leur effet cumulé. Les auteurs suggèrent de les évaluer ensemble, si l’objectif est d’avoir des agents à la fois engageants et moins risqués pour les esprits vulnérables.

Pour vous, le signal pratique tient en une phrase : si un agent vous donne systématiquement raison, adopte votre manière de parler et semble vous connaître mieux que personne, c’est exactement le trio que des psychiatres pointent du doigt. Le bon réflexe à avoir, quand une idée vous isole ou vous obsède, c’est d’aller la confronter à un humain.

Source : NPP-Digital Psychiatry and Neuroscience

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *