Hier soir, OpenAI a annoncé le lancement en accès limité de GPT-5.6, sa nouvelle génération de modèles. Au programme, trois nouvelles versions avec une stratégie totalement différente.
Un peu plus de deux mois après avoir lancé GPT-5.5, OpenAI relance une nouvelle version de son modèle en accès limité pour le moment.
Dans un tweet publié hier soir, l’entreprise a officialisé l’arrivée de GPT-5.6 Sol, son nouveau modèle frontière, accompagné de deux variantes : GPT-5.6 Terra et GPT-5.6 Luna. D’un côté, OpenAI veut reprendre l’avantage sur les performances, notamment face à Anthropic. De l’autre, l’entreprise installe une nouvelle nomenclature qui rappelle la logique de gamme déjà utilisée par son rival.
Que vaut GPT-5.6 sur le papier ?
Avec GPT-5.6 Sol, OpenAI présente son modèle le plus avancé à ce jour. La firme met surtout en avant des progrès sur les tâches agentiques : le code, les workflows longs, la biologie quantitative et la cybersécurité. Sur TerminalBench 2.1, un benchmark qui me la capacité des modèles à gérer des tâches en ligne de commande nécessitant planification, itération et coordination d’outils, GPT-5.6 Sol arrive devant une grande partie de la concurrence selon OpenAI.
| Modèle | Score sur TerminalBench 2.1 |
|---|---|
| GPT-5.6 Sol Ultra | 91,9 % |
| GPT-5.6 Sol | 88,8 % |
| Claude Mythos 5 | 88 % |
| GPT-5.6 Terra | 84,3 % |
| GPT-5.5 | 83,4 % |
| GPT-5.6 Luna | 82,5 % |
L’amélioration ne se limite pas seulement au code. OpenAI affirme que GPT-5.6 Sol obtient de meilleurs résultats que GPT-5.5 tout en utilisant moins de tokens. En pleine épidémie de « tokenmaxxing », où les IA multiplient les raisonnements longs et les sorties interminables, l’enjeu se trouve dans l’efficacité. OpenAI ne cherche plus seulement à dire que son modèle est plus intelligent, mais aussi à prouver qu’il est capable d’obtenir de meilleurs résultats avec moins de calcul et moins de coûts.
- GPT-5.6 Luna plafonne autour de 14-15 % pour moins de 1 dollar.
- GPT-5.5 atteint environ 23 % pour près de 1,2 dollar.
- GPT-5.6 Terra monte autour de 28 % pour environ 1,7 dollar.
- GPT-5.6 Sol atteint environ 31 % de score pour près de 1,9 dollar de coût API.
Trois noms, la stratégie d’Anthropic chez OpenAI
La nouvelle gamme d’OpenAI en dit également long sur sa stratégie. Elle se structure comme suit :
- Luna est le modèle rapide et abordable, destiné aux volumes importants ;
- Terra est le modèle du quotidien, avec un compromis entre puissance, rapidité et coût ;
- Sol est le modèle le plus puissant, pensé pour les tâches les plus complexes.
OpenAI lance d’abord Sol, Terra et Luna en accès limité, via l’API et Codex, auprès d’un petit groupe de partenaires de confiance. La raison évoquée est une décision du gouvernement américain, qui veut désormais évaluer les capacités cyber des modèles les plus avancés avant leur diffusion large. OpenAI reste optimiste et prévoit de rendre GPT-5.6 accessible à tous dans les prochaines semaines.
Source : OpenAI
