Claude Mythos : un modèle d’IA trop dangereux pour être rendu public

Claude Mythos : un modèle d’IA trop dangereux pour être rendu public

Ce mardi 7 avril 2026, Anthropic a dévoilé le Claude Mythos Preview, un modèle généraliste de pointe qu’elle refuse de rendre public, tout en lançant le Project Glasswing, une initiative de cyberdéfense réunissant une cinquantaine d’organisations partenaires. Selon Anthropic, ce modèle a identifié des milliers de vulnérabilités critiques dans les principaux systèmes d’exploitation et navigateurs web lors de tests internes.

Claude Mythos Preview : un modèle aux capacités cyber hors norme

Le Claude Mythos Preview n’a pas été spécifiquement entraîné pour la cybersécurité. Ses performances dans ce domaine sont attribuées à des avancées en raisonnement, en codage agentique et en autonomie. Sur le benchmark SWE-bench Verified, il obtient un score de 93,9 %, comparé à 80,8 % pour le modèle public le plus avancé d’Anthropic, Claude Opus 4.6.

Anthropic précise que les compétences en programmation et en raisonnement automatisés du modèle lui permettent d’atteindre les meilleurs scores sur diverses tâches de programmation logicielle. En cybersécurité, Mythos Preview affiche un score de 83,1 % sur CyberGym, contre 66,6 % pour Opus 4.6. Sur Cybench, un ensemble de 35 défis de type Capture The Flag, le modèle obtient un score parfait de 100 %, rendant ce test obsolète pour cette génération de modèles.

Une arme potentielle pour les cyberattaquants ?

Fin mars 2026, une fuite de données internes avait révélé l’existence du projet Mythos, suscitant des inquiétudes dans le secteur de la cybersécurité. Le document indiquait que le modèle pouvait détecter des vulnérabilités, renforçant la crainte qu’il puisse devenir un outil pour des acteurs malveillants. Anthropic a déclaré que même des non-experts pouvaient utiliser Mythos Preview pour exploiter des vulnérabilités sophistiquées.

Le modèle a identifié de manière autonome un bug vieux de 27 ans dans OpenBSD, permettant à un attaquant de faire planter à distance n’importe quelle machine utilisant ce système. Il a également découvert une faille de 16 ans dans FFmpeg, ainsi que plusieurs vulnérabilités dans le noyau Linux, permettant l’escalade de privilèges jusqu’au contrôle total d’une machine. En mars, Anthropic a annoncé avoir identifié 112 bugs dans Firefox, dont 14 critiques.

Project Glasswing : un accès restreint aux défenseurs

Anthropic a également présenté le Project Glasswing, qui vise à déployer Mythos Preview uniquement à des fins défensives. L’accès au modèle sera limité à un groupe sélectionné d’organisations responsables de la sécurité des infrastructures logicielles critiques. Parmi les partenaires de lancement figurent AWS, Apple, Microsoft, Google et la Linux Foundation. Anthropic s’engage à investir 100 millions de dollars en crédits d’utilisation et 4 millions de dollars en dons à des organisations de sécurité open source.

L’entreprise ne prévoit pas de rendre Mythos Preview accessible au grand public, mais vise à déployer des modèles similaires une fois des garde-fous suffisants établis. Anthropic poursuit également des discussions avec le gouvernement américain concernant les capacités offensives et défensives de Claude Mythos Preview.

Source : Anthropic

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *