au sommaire


    Le 14 mars 2023, OpenAI a annoncé la sortie de GPT-4, un nouveau modèle d'intelligence artificielle (IAIA) pour ChatGPTChatGPT. Quelles sont donc les caractéristiques de GPT-4 ?

    Le grand public connaît ChatGPT comme un chatbot ou interface de conversation intelligente. Qu'en est-il dans la pratique ? Lorsque vous posez votre question à ChatGPT, celui-ci délègue la tâche d'analyse de votre requête et l'élaboration d'une réponse à un modèle de langage - on parle aussi de LLM (Large Langage Model ou Modèle de langage étendu).

    C'est le modèle de langage qui va faire toute la différence dans le traitement de votre question. Voici quelques exemples de tels modèles LLM :

    GPT-3.5   

    Utilisé par la version gratuite de ChatGPT

    GPT-4 

    Proposé avec la version payante ChatGPT Plus

    LaMDA

    Le modèle mis à contribution par GoogleGoogle Bard

    BERT

    Un autre modèle développé par Google

    LLaMA

    Développé par Meta pour son chatbot Blenderbot

    BloomBloom

    Un modèle open source prometteur créé sous la supervision de HuggingFace

    Gopher

    Un LLM développé par DeepMind, une filiale de Google

    Qu'est-ce qui distingue un modèle de langage ?

    C'est la puissance d'un modèle IA de langage LLM qui va faire toute la différence dans l'efficacité d'un chatbot tel que ChatGPT. Les critères par lesquels on peut évaluer un tel modèle sont nombreux. En voici quelques-uns :

    Le nombre de paramètres sur lequel il a été entraîné

    Chaque modèle existant a été entraîné sur un certain nombre de paramètres. Plus ce nombre est important et plus le modèle a des chances d'être fiable. Quelques exemples :

    • LLaMA a été entraîné - selon ses versions - sur un volumevolume allant de 7 à 65 milliards de paramètres ;
    • GPT-3 a été entraîné sur 175 milliards de paramètres ;
    • Bloom a été entraîné sur 176 milliards de paramètres ;
    • Gopher a été entraîné sur 280 milliards ;
    • GPT-3.5 sur 355 milliards de paramètres.

    Le volume de texte pris en compte

    La quantité de texte qu'un LLM peut traiter va également influer sur ses performances. À titre d'exemple, lorsque nous lui demandons de résumer un texte, par exemple celui d'une page Web, GPT-3.5 ne peut prendre en compte qu'environ 3 000 mots.

    En réalité, en IA on parle plutôt de « token » comme unité analysée, soit quatre caractères. Dans le cas présent, les 3 000 mots correspondent à 4 096 tokens. Si le texte contient davantage de caractères, le chatbot se déclare incapable d'effectuer la tâche.

    Le nombre de mots précédents pris en compte

    Un modèle de langage fonctionne selon un critère précis : en analysant les mots qui précèdent dans un texte, il tente de prédire quel est le mot qui a le plus de chance d'être le suivant. Cela peut sembler étrange, mais prenons un exemple ultra-simple pour mieux illustrer cette logique. Si vous voyez comme suite de mots « Christophe Colomb a découvert l'Amérique en », un seul terme vous vient à l'esprit pour la compléter : « 1492 ». Un LLM fonctionne sur ce même principe et à très grande échelle. Ainsi, GPT 3.5 peut prendre en compte les 3 000 mots précédents.

    Les éléments qui peuvent être inclus dans une requête

    La plupart des modèles ne peuvent accepter que du texte en entrée. Certains peuvent lire le contenu de pages Web, de fichiers PDF. Lors de la conférence de lancement organisée le 14 mars, GPT-4 a été annoncé comme ayant la capacité de pouvoir analyser des images.

    Les caractéristiques de GPT-4

    ChatGPT Plus, la version payante de ChatGPT, peut s'appuyer sur trois modèles d'IA : deux versions de GPT 3.5 et GPT-4.

    ChatGPT Plus peut s'appuyer sur trois modèles d'IA : deux versions de GPT 3.5 et GPT-4. © OpenAI
    ChatGPT Plus peut s'appuyer sur trois modèles d'IA : deux versions de GPT 3.5 et GPT-4. © OpenAI

    Ces critères ayant été posés, nous pouvons mieux évaluer ce qui distingue GPT-4 d'autres modèles, notamment GPT-3.5.

     

    GPT-4

    GPT-3.5

    Nombre de paramètres sur lequel il a été entraîné

    100 000 milliards

    175 milliards

    Volume de texte pris en compte

    25 000

    3 000

    Combien de mots précédents il peut analyser

    Environ 6 000  (8 192 tokens ou unités de 4 caractères). Il est censé pouvoir monter jusqu'à 32 768 tokens.

    Environ 3 000 (4 096 tokens )

    Nombre de langues supportées

    26

    25

    Peut accepter des images en entrée

    Oui

    Non

    Peut analyser des fichiers PDF

    Oui

    Non

    Comme on peut le voir, la progression est majeure sur de nombreux critères. Et cet accroissement de puissance est vérifiable sur la majorité des requêtes : GPT-4 amène ChatGPT à produire des réponses plus exactes (même s'il lui arrive encore de se tromper), plus détaillées, généralement mieux formulées. Et il fait preuve d'une logique plus poussée.

    GPT-4 testé par OpenAI

    OpenAI a testé les capacités de GPT-4 sur plusieurs examens américains majeurs. Il a obtenu plusieurs résultats de haut niveau.

    Les performances de GPT-4 (en vert) par comparaison à celles de GPT-3.5 (en bleu) aux principaux examens américains. © OpenAI
    Les performances de GPT-4 (en vert) par comparaison à celles de GPT-3.5 (en bleu) aux principaux examens américains. © OpenAI

    Parmi les prouesses accomplies figurent les suivantes :

    • un score de 5/5 sur l'examen de biologie AP Biology ;
    • un score de 298/400 à l'examen UBE du barreau américain, le plaçant dans le Top 10 % des étudiants ;
    • la note 700/800 au SAT de mathématiques et 710/800 au SAT de lecture et d'écriture, le SAT étant l'examen d'entrée à l'université ;
    • 88 % de bonnes réponses au LSAT, test d'admission à la faculté de droit.

    Comment accéder à GPT-4 ?

    Lorsque vous êtes sur ChatGPT, repérez la mention « Upgrade to Plus » dans la colonne de gauche et cliquez dessus. Vous êtes transféré vers un écran vous proposant de vous abonner à raison de 20 dollars par mois (plus 4 $ de TVA). Si vous souscrivez à un tel abonnement, vous pouvez alors accéder à ChatGPT Plus et exploiter les performances de GPT-4.

    Champ lexical : chatGPT Plus | chatGPT 4