OpenAI développe des puces IA Jalapeño pour améliorer les performances des LLM.

Nombre de lecteurs : 5

Les puces IA Jalapeño d'OpenAI : accélérateur maison pour LLM

OpenAI Lève le Voile sur les Puces IA Jalapeño : Un Accélérateur Spécifique pour les Grands Modèles de Langage

OpenAI a récemment dévoilé les puces IA Jalapeño, un accélérateur conçu en collaboration avec Broadcom, spécifiquement destiné à optimiser l’inférence des grands modèles de langage (LLM). Cette innovation marque une avancée significative dans le domaine de l’intelligence artificielle, illustrant la volonté d’OpenAI de maîtriser l’ensemble de sa pile technologique.

Une Architecture Innovante

Les puces Jalapeño ont été entièrement conçues de zéro, en se basant sur une compréhension approfondie des fondamentaux des LLM. L’architecture est optimisée pour réduire les déplacements de données tout en équilibrant les ressources de calcul, de mémoire et de réseau. Cela permet une utilisation plus efficace, plus proche des capacités théoriques maximales. Selon OpenAI, des tests préliminaires avec des charges de travail comme GPT-5.3-Codex-Spark ont montré une amélioration substantielle en termes de performance par watt par rapport aux accélérateurs existants.

Un Développement Rapide

Le cycle de développement des puces Jalapeño a été particulièrement rapide, prenant seulement neuf mois depuis le concept initial jusqu’à la fabrication. Ce délai record est attribué à une co-conception étroite entre OpenAI et Broadcom, ainsi qu’à l’utilisation des modèles IA propres à OpenAI pour accélérer certaines phases de conception.

Partenaires Clés

Broadcom joue un rôle crucial dans l’implémentation silicium et les technologies réseau, tandis que Celestica est responsable de l’intégration des systèmes de production à grande échelle. Ce partenariat est essentiel pour garantir le succès et l’efficacité de la mise en œuvre des puces Jalapeño.

Perspectives d’Avenir

Le déploiement initial des puces Jalapeño est prévu avant la fin de l’année 2026, avec des centres de données à l’échelle du gigawatt en collaboration avec Microsoft. À terme, ces puces visent à réduire les coûts d’inférence pour tous les utilisateurs, améliorant ainsi la rapidité des réponses de ChatGPT et rendant l’API plus accessible pour les développeurs.

OpenAI envisage un avenir où l’infrastructure full-stack permettra un calcul plus abondant et une intelligence artificielle plus rapide et fiable.

Source : Intelligence Artificielle

Source