OpenAI dépasse Claude Mythos 5 avec GPT-5.5-Cyber
Depuis plusieurs semaines, Claude Mythos, l’intelligence artificielle développée par Anthropic, est au cœur des discussions en raison de ses capacités avancées, notamment en matière de cybersécurité. Toutefois, alors que Claude Mythos 5 est actuellement suspendu suite à une directive du gouvernement américain, OpenAI a récemment lancé GPT-5.5-Cyber, une version optimisée de son modèle pour le cyberespace.
D’après les résultats des évaluations publiées par OpenAI, GPT-5.5-Cyber a atteint un score de 85,6 % sur le benchmark CyberGym, surpassant ainsi les 83,8 % obtenus par Claude Mythos 5. Cette évaluation vise à mer la performance des modèles d’IA dans l’analyse des vulnérabilités des logiciels. Cependant, 5-Cyber n’est pas accessible au grand public ; tout comme Claude Mythos, cette IA est réservée à un usage défensif pour un nombre restreint d’organisations.
En parallèle, OpenAI a annoncé une mise à jour pour Codex Security, son plugin dédié à la cybersécurité, ainsi qu’une extension de l’accès à son programme Daybreak. Ce dernier permet aux organisations d’utiliser Codex Security et GPT-5.5 with Trusted Access for Cyber, une IA moins avancée que GPT-5.5-Cyber.
Contexte factuel
OpenAI a fait ces annonces à un moment où son concurrent, Anthropic, n’a pas encore réussi à rétablir l’accès à Claude Mythos 5 et Claude Fable 5. Le gouvernement américain a invoqué des raisons de sécurité nationale pour justifier le blocage de ces modèles pour les ressortissants étrangers. En conséquence, Anthropic a suspendu ces deux IA pour tous les utilisateurs.
Des discussions sont en cours entre Anthropic et les autorités américaines. Récemment, Donald Trump a déclaré, après une rencontre avec le CEO d’Anthropic au sommet du G7, qu’il ne considère plus cette entreprise comme une menace pour la sécurité nationale.
Données ou statistiques
- GPT-5.5-Cyber : 85,6 % sur le benchmark CyberGym
- Claude Mythos 5 : 83,8 % sur le même benchmark
Conséquence directe
Cette situation pourrait renforcer la position d’OpenAI sur le marché des solutions de cybersécurité, alors qu’Anthropic fait face à des restrictions qui limitent l’accès à ses modèles avancés.
Source : Presse-citron.
