Avec Jalapeño, OpenAI crée son propre silicium pour inférer ses IA

OpenAI lance Jalapeño, son propre processeur d’inférence

OpenAI a annoncé cette semaine le lancement de « Jalapeño », son premier accélérateur développé en collaboration avec Broadcom. Cette initiative souligne la volonté croissante des entreprises technologiques de réduire les coûts d’inférence et de mieux contrôler l’ensemble de leurs infrastructures d’intelligence artificielle (IA).

Jalapeño n’est pas un GPU classique, mais un « Intelligence Processor », un ASIC (circuit intégré spécifique) optimisé pour l’inférence de grands modèles de langage. Conçu pour exécuter les modèles déjà entraînés d’OpenAI, il vise à améliorer l’efficacité des réponses fournies par ChatGPT, Codex et l’API d’OpenAI, ainsi que d’éventuels futurs produits.

La conception de Jalapeño s’appuie sur les propres kernels et modèles d’OpenAI, prenant en compte divers facteurs tels que la mémoire, les transferts de données et la latence. Cependant, les détails techniques restent limités, avec peu d’informations sur le nombre de cœurs ou la finesse de gravure. OpenAI affirme que des prototypes sont en cours de test, promettant une efficacité par watt supérieure à celle des technologies existantes. Broadcom a même indiqué que Jalapeño pourrait rivaliser avec les solutions Nvidia Blackwell et les TPU de Google, bien qu’aucun benchmark n’ait encore été publié.

Un partenariat stratégique avec Broadcom

Le partenariat entre OpenAI et Broadcom, établi en 2025, prévoit le déploiement de 10 GW d’accélérateurs IA entre 2026 et 2029. Ce partenariat vise à diminuer les coûts d’inférence et à sécuriser l’accès aux ressources informatiques, tout en réduisant la dépendance d’OpenAI vis-à-vis de Nvidia. Broadcom joue un rôle clé en tant qu’architecte industriel, fournissant l’implémentation matérielle et les infrastructures nécessaires pour transformer les concepts en solutions exploitables.

Motivations derrière le développement de Jalapeño

OpenAI cherche à maîtriser trois aspects essentiels : le coût, la capacité et le contrôle. L’inférence, qui consomme des tokens à chaque requête, devient un enjeu stratégique, surtout avec l’essor des agents IA. La création d’un processeur dédié permet à OpenAI d’optimiser ses coûts spécifiques tout en maintenant une certaine indépendance vis-à-vis de Nvidia, bien que les GPU restent cruciaux pour l’entraînement de modèles avancés.

Stratégies variées parmi les acteurs du secteur

Parallèlement, d’autres grandes entreprises technologiques, telles que Google, AWS et Microsoft, développent également leurs propres puces d’inférence. En revanche, en Chine, des entreprises comme Huawei adoptent une approche différente pour contourner les restrictions d’accès aux GPU américains, en utilisant des supernœuds et une interconnexion avancée.

Jalapeño représente une tendance croissante dans le secteur de l’IA : la bataille pour la suprématie ne se jouera pas seulement sur la qualité des modèles, mais aussi sur l’efficacité économique des réponses générées.

Source : Informatique News

Source
Leave a Comment

Comments

No comments yet. Why don’t you start the discussion?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *