Amélioration de la vitesse et de l’efficacité énergétique des agents d’IA grâce à un nouveau système
Des chercheurs du Massachusetts Institute of Technology (MIT) et de Microsoft ont développé un système intelligent visant à optimiser les « workflows agentiques », des systèmes logiciels alimentés par l’intelligence artificielle qui combinent plusieurs modèles et outils externes pour effectuer des tâches complexes, comme l’analyse de vidéos et la réponse à des questions.
Ces systèmes, bien que puissants, présentent souvent des inefficacités dues à leur conception fragmentée, entraînant des gaspillages de calcul, d’énergie et de coûts. Pour remédier à cela, le nouveau système permet aux développeurs de définir leurs intentions en langage simple, sans avoir à spécifier tous les détails techniques au préalable. Ce système détermine automatiquement les modèles et outils les plus adaptés, ainsi que la configuration matérielle et l’allocation des ressources nécessaires lors de l’exécution du workflow par un fournisseur de cloud.
Lors des tests effectués sur plusieurs workloads agentiques, ce système a permis de réduire le nombre d’unités de calcul nécessaires pour le déploiement, diminuant ainsi de manière significative les exigences énergétiques et les coûts par rapport aux méthodes traditionnelles, tout en conservant des niveaux de performance satisfaisants.
Gohar Chaudhry, étudiant diplômé en ingénierie électrique et en informatique au MIT et auteur principal d’un article sur ce système, a souligné : « Les workflows agentiques deviennent très complexes et constituent rapidement l’épine dorsale des services fournis par les fournisseurs de cloud. L’utilisation d’énergie est une préoccupation majeure, et il est crucial d’asr l’efficacité de ces workflows. »
Le système, nommé Murakkab (qui signifie « composition » en ourdou), permet aux développeurs de créer des workflows en décrivant simplement l’application souhaitée. Par exemple, un développeur pourrait concevoir une application de questions-réponses sur une vidéo qui extrait des images clés, génère une transcription et répond ensuite aux requêtes des utilisateurs. Murakkab identifie automatiquement les meilleurs modèles et outils à utiliser et détermine les composants à exécuter en série ou en parallèle pour optimiser la performance.
Les tests ont montré que Murakkab répondait aux exigences des utilisateurs tout en utilisant environ 35 % des ressources de calcul nécessaires selon d’autres méthodes, et consommait seulement 27 % de l’énergie pour moins de 25 % des coûts.
Les chercheurs prévoient d’élargir leur système à des workflows plus complexes et à des clusters de calcul plus importants, tout en cherchant à optimiser de nouvelles applications agentiques.
Cette recherche a été soutenue en partie par la Semiconductor Research Corporation et la Defense Advanced Research Projects Agency des États-Unis.
Source : MIT News
