Anthropic accuse Alibaba d’« adversarial distillation » : un nouveau conflit dans le domaine de l’IA
L’intelligence artificielle entre dans une nouvelle phase de son affrontement géopolitique. Après la bataille des semi-conducteurs et des infrastructures de données, l’exploitation des modèles d’IA devient un enjeu crucial. Dans un courrier adressé à plusieurs sénateurs américains et à la Maison-Blanche, Anthropic accuse Alibaba d’avoir orchestré, entre avril et juin 2026, une campagne reposant sur près de 25 000 comptes frauduleux pour générer 28,8 millions d’interactions avec son modèle Claude. L’entreprise américaine soutient que l’objectif de cette opération n’était pas d’utiliser l’assistant conversationnel, mais d’extraire ses capacités pour entraîner des modèles concurrents, qualifiant cette démarche de « distillation adversariale » à l’échelle industrielle.
La distillation, en soi, est une technique classique du machine learning, où un modèle de grande taille, le « teacher », sert à entraîner un modèle plus compact, le « student ». Cette méthode permet d’optimiser les ressources en réduisant la mémoire et la puissance de calcul nécessaires. Cependant, l’« adversarial distillation » diffère fondamentalement en ce qu’elle implique l’interrogation massive d’un modèle concurrent pour en structurer les réponses et les réinjecter dans un processus d’entraînement. Dans ce cas, Claude deviendrait involontairement le professeur d’un modèle concurrent.
Développer un modèle comme Claude nécessite des investissements colossaux, se chiffrant en milliards d’euros, mobilisant des infrastructures de calcul parmi les plus puissantes et des mois d’entraînement continu. La distillation permettrait de réduire considérablement ces coûts en récupérant des schémas de raisonnement et des stratégies de résolution de problèmes à partir d’un modèle existant. Cela soulève des préoccupations majeures pour l’industrie, qui voit cette pratique comme une manière de capter une partie de la valeur créée sans supporter les mêmes investissements.
Les chiffres avancés par Anthropic illustrent un changement d’échelle significatif. En effet, l’entreprise évoque près de 25 000 comptes frauduleux ayant généré 28,8 millions de conversations en seulement trois mois, ciblant principalement les capacités avancées de Claude, telles que le développement logiciel. Cette situation dépasse le cadre d’un usage abusif d’une API, décrivant plutôt une infrastructure automatisée capable de contourner les limitations de comptes, rapprochant ces pratiques de cyberespionnage.
Cette affaire soulève des questions juridiques complexes concernant la frontière entre l’apprentissage et la reproduction. Si tous les laboratoires évaluent les modèles concurrents, la difficulté réside dans la définition de ce qui constitue une tentative de reproduction industrielle. Le débat se déplace ainsi du terrain contractuel vers celui de la sécurité nationale, offrant la possibilité de sanctions économiques et d’interventions gouvernementales.
Les conséquences de cette situation pourraient également être techniques, poussant les laboratoires à rendre la distillation plus difficile et détectable. Cela ouvre un nouveau champ pour la cybersécurité appliquée à l’intelligence artificielle, avec des pistes telles que la détection comportementale des utilisateurs et les mécanismes de watermarking.
Source : Bloomberg.
