zAI Réintroduit les Grands Modèles Open Weight avec GLM 5.2
Zhipu AI, plus connu sous le nom de zAI, a récemment dévoilé son nouveau modèle de langage, GLM 5.2, le 16 juin dernier. Ce modèle se distingue par un score de 51 points sur 100 dans le banc d’essai Intelligence Index, surpassant son prédécesseur, GLM 5.1, de 11 points de pourcentage. GLM 5.2 est désormais le modèle open weight le mieux noté, devançant MiniMax M3 (44 points), DeepSeek V4 Pro (44 points) et Kimi K2.6 (43 points). Il se positionne juste derrière GPT-5.5 (55 points) et Claude Opus 4.8 (56 points).
Une Fenêtre de Contexte Élargie
GLM 5.2 utilise une architecture de type « mixture of Experts » avec 744 milliards de paramètres, dont 40 milliards actifs. Il propose une fenêtre de contexte de 1 million de tokens, contre 200 000 pour GLM 5.1. zAI souligne la robustesse de cette fonctionnalité, affirmant que garantir la fiabilité d’un tel contexte face aux contraintes réelles de l’ingénierie est un défi majeur. La société a également introduit la technique IndexShare, visant à réduire le coût de calcul associé au mécanisme DeepSeek Sparse Attention.
Optimisation des Ressources
La startup a mis en place une technique nommée LayerSplit pour mieux gérer la mémoire, permettant de diviser les couches du modèle sur plusieurs GPU. Cela améliore la capacité de cache lors de requêtes longues et réduit les temps d’attente dans le pipeline d’exécution. Les efforts de zAI pour optimiser l’entraînement incluent également la compression des traces de raisonnement et la détection de tentatives de « reward hacking ».
Coûts et Accessibilité
GLM 5.2 génère en moyenne 43 000 tokens pour chaque tâche, contre 26 000 pour GLM 5.1. Les tarifs de zAI sont compétitifs, avec un coût de 1,4 dollar pour 1 million de tokens en entrée et 4,4 dollars pour la sortie. Cette stratégie tarifaire permet à zAI d’offrir un rapport performance-prix comparable à ses concurrents.
Conclusion
GLM 5.2 est désormais accessible sur diverses plateformes, y compris AWS et d’autres acteurs spécialisés. En tant que modèle open weight, il offre également la possibilité d’hébergement local, bien que cela nécessite des compromis techniques.
Source : Artificial Analysis, zAI
