L'IA de Meta se révèle plus efficace que GPT-3 sur de nombreuses tâches

Pour tenter de résoudre les problèmes d’erreurs des intelligences artificielles, ou « hallucinations », Meta propose de confier des tâches basiques à des outils externes.

au sommaire

Au fur et à mesure qu'elles évoluent, les nouvelles intelligences artificielles, comme ChatGPTChatGPT ou GoogleGoogle Bard, sont capables de s'attaquer à des tâches de plus en plus complexes. Toutefois, elles affichent des difficultés croissantes pour certaines tâches des plus basiques, comme le calcul ou la recherche d'informations factuelles.

Meta tente actuellement de résoudre ce problème en apprenant tout simplement à une IA à utiliser des outils. Des chercheurs de Meta AI Research ont publié un article qui présente « Toolformer », une IA basée sur le modèle de langage GPT-J, un modèle proche de GPT-2 mais développé par EleutherAI, une communauté de chercheurs. Ils lui ont appris à utiliser des API (interfaces de programmation d'applicationapplication), des outils qui permettent aux logiciels de communiquer entre eux.

Une IA plus efficace que GPT-3

Les chercheurs ont entraîné Toolformer en lui montrant quelques exemples d'utilisation des API de différents logiciels, comme une calculatrice, un moteur de recherche, un système de questions-réponses, un traducteur et un calendrier. L’intelligence artificielle a su apprendre tout seule à intégrer l'utilisation de ces outils lors des requêtes, décider à quelle API faire appel, à quel moment, quels paramètres utiliser et comment intégrer les résultats dans sa réponse.

L'IA Toolformer s'est révélée plus efficace que GPT-3 sur de nombreuses tâches, malgré une grande différence de complexité. GPT-3 compte 175 milliards de paramètres, contre seulement 6,7 milliards pour GPT-J. Les chercheurs ont toutefois souligné quelques limites, puisque l'intelligence artificielle n'est pas capable d'utiliser les logiciels en chaîne, en utilisant le résultat pour faire une requête sur un autre.