Des chercheurs du MIT enseignent aux modèles d’IA à interpréter les graphiques
Des chercheurs du Massachusetts Institute of Technology (MIT) et du MIT-IBM Computing Research Lab ont développé un nouvel outil pour aider les modèles d’intelligence artificielle (IA) à interpréter efficacement les graphiques. Cette initiative vise à combler les lacunes de performance des modèles actuels, qui peinent souvent à intégrer des informations visuelles, numériques et linguistiques.
Pour répondre à ce besoin, les chercheurs ont créé un ensemble de données, nommé ChartNet, comprenant plus d’un million de graphiques variés. Cet ensemble de données inclut des éléments visuels, linguistiques et numériques, permettant aux modèles d’analyser de manière robuste les informations présentées dans les graphiques. Les résultats montrent que des modèles open-source, formés avec ChartNet, surpassent de manière significative des modèles commerciaux beaucoup plus grands dans des tâches telles que l’extraction de données et la synthèse de graphiques.
L’importance de cette avancée est particulièrement significative pour les petites entreprises, qui peuvent ainsi accéder à des outils d’IA performants sans nécessiter de budgets importants. Le développement de ChartNet pourrait faciliter l’analyse des tendances commerciales et l’interprétation de figures scientifiques.
Jovana Kondic, étudiante diplômée en ingénierie électrique et en informatique au MIT et auteur principal d’un article sur ChartNet, a déclaré : « Nous avons développé ChartNet pour être une solution complète pour la compréhension des graphiques, couvrant tout ce dont un modèle d’IA et un praticien pourraient avoir besoin. »
Le manque de données d’entraînement de haute qualité a longtemps été un obstacle au développement de modèles d’IA capables d’interpréter avec précision les graphiques. Les chercheurs ont surmonté ce défi en générant des données synthétiques, imitant les propriétés statistiques des données réelles. L’ensemble de données ChartNet comprend des images de graphiques de haute qualité, accompagnées de descriptions textuelles et d’informations numériques, ce qui permet d’enseigner aux modèles comment répondre correctement aux questions sur chaque graphique.
Les chercheurs prévoient de continuer à enrichir ChartNet en intégrant des données plus complexes et en recueillant des retours de la communauté de recherche. Cette recherche a été en partie financée par le MIT-IBM Computing Research Lab.
Source : MIT News
