OpenAI dévoile GPT-5.6 Sol, un nouveau modèle réservé aux partenaires approuvés par la Maison-Blanche

OpenAI dévoile GPT-5.6 Sol, un modèle limité aux partenaires approuvés par la Maison-Blanche

OpenAI a récemment annoncé le lancement de la série GPT-5.6, qui succède à GPT-5.5 et présente des améliorations notables dans les domaines du codage, de la biologie et de la cybersécurité. Cette nouvelle série comprend trois modèles : Sol, Terra et Luna. Cependant, à la demande de l’administration Trump, la diffusion de ces modèles est pour l’instant restreinte à un cercle limité de partenaires, dont la liste a été transmise au gouvernement américain.

Un nouveau système de nommage et deux modes de raisonnement inédits

Traditionnellement, OpenAI nommait ses modèles en fonction de leur usage, tels que Thinking, Instant et Cyber. Avec GPT-5.6, la société adopte un système basé sur les capacités : Sol est le modèle le plus puissant, Terra est conçu pour un équilibre optimal, et Luna est une version rapide et économique. Ces appellations devraient rester constantes à chaque nouvelle génération.

Sol se distingue comme le modèle le plus performant d’OpenAI à ce jour. La série introduit deux nouveaux modes de raisonnement : un mode « max », qui permet des analyses plus approfondies, et un mode « ultra », qui utilise plusieurs sous-agents pour traiter des tâches complexes simultanément. ChatGPT et Codex intégreront bientôt cette série, après une phase de prévisualisation réservée aux partenaires sélectionnés. Sol sera également accessible via l’infrastructure Cerebras, avec des vitesses pouvant atteindre 750 tokens par seconde pour des clients choisis.

Des gains concrets en codage, biologie et cybersécurité

GPT-5.6 Sol présente des améliorations significatives par rapport à son prédécesseur dans trois domaines clés :

  • Codage : Sol améliore les workflows en ligne de commande nécessitant planification, itérations et coordination d’outils.
  • Biologie : Le modèle traite les analyses génomiques complexes en utilisant moins de tokens que GPT-5.5.
  • Cybersécurité : Sol affiche des performances comparables à celles de Claude Mythos Preview d’Anthropic, tout en consommant environ un tiers des tokens en sortie.

Cependant, Sol ne dépasse pas le seuil « Cyber Critical » établi par OpenAI. Lors d’évaluations avec Chromium et Firefox, il a identifié des bogues et des primitives d’exploitation, mais n’a pas réussi à produire une exploitation complète de manière autonome. OpenAI souligne que les seuils de référence ne peuvent pas couvrir toutes les utilisations possibles d’un modèle.

Le gouvernement américain s’impose comme arbitre des lancements IA

Avant le lancement, OpenAI a présenté ses modèles à l’administration Trump, qui a demandé que la diffusion soit limitée dans un premier temps. La firme travaille en collaboration avec l’exécutif, mais indique que ce type de processus « ne devrait pas devenir la norme à long terme », car cela prive divers acteurs des meilleurs outils disponibles. Malgré cela, OpenAI n’a pas montré une résistance significative face aux demandes de Washington, qui pourrait chercher à généraliser ce contrôle.

Il y a quelques semaines, le gouvernement avait déjà contraint Anthropic à désactiver l’accès à Claude Mythos 5 et Claude Fable 5, invoquant des préoccupations de cybersécurité. Après des négociations, l’administration a partiellement levé la restriction, permettant à Anthropic de redéployer Mythos 5 auprès de plus de 100 institutions américaines, tandis que Fable 5 reste désactivé.

Source : Blog du Modérateur

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *