ChatGPT fonce droit dans le mur de la connaissance !

ChatGPT

Intelligence artificielle

Connaissances

actualité

• 3 Min

Articles de presse, plaidoyers ou encore codes informatiques. Les folles capacités de rédaction de ChatGPT fascinent. Mais certains lui prédisent d’ores et déjà un avenir moins radieux. Dès lors que l’Intelligence artificielle se sera heurtée… au mur de la connaissance !

au sommaire

ChatGPTChatGPT. Plusieurs semaines, maintenant, que cet étonnant outil conversationnel fait la Une. Parce qu'il est capable de générer du contenu à la demande. Des articles de presse -- même l'actualité scientifique ? --, des plaidoyers ou encore des codes informatiques. Comment ? En s'appuyant sur une Intelligence artificielle et sur un apprentissage automatique en continu. De quoi lui permettre de devenir de plus en plus performant au fil du temps. Pour ceux que l'idée angoisse un peu, un groupe de chercheurs spécialisés dans l'étude de l'Intelligence artificielle et de ses capacités a peut-être une bonne nouvelle aujourd'hui.

Tout simplement parce que ChatGPT a beau être intelligent, il n'apprend que grâce aux informations disponibles autour de lui. Des informations produites... par des humains. Selon l'étude publiée par lesdits chercheurs, c'est sa boulimieboulimie d'informations qui pourrait bien être fatale à l'Intelligence artificielle. Si elle continue ainsi à consommer des données plus vite que nous pouvons en produire de nouvelles. Les ressources en contenu « de haute qualité » pourraient ainsi être épuisées dès 2026 !

Rappelons que les performances d'une Intelligence artificielle reposent sur les algorithmes et la puissance de calcul. Mais aussi sur la qualité des données injectées dans les modules d'apprentissage. Alors les chercheurs se sont demandé combien de temps encore les Intelligences artificielles de type ChatGPT trouveraient dans leur environnement de quoi progresser.

Une boulimie de connaissance fatale ?

Ils ont estimé la taille du stock de données disponibles et évalué la manière dont il se développe. Ils ont comparé leurs chiffres à la taille et à l'évolution des ensembles de données d'apprentissage de l'Intelligence artificielle. Selon leurs travaux, il y aurait actuellement entre 7x10¹³ et 7x10¹⁶ mots disponibles dans le stock mondial de données de l'humanité. Un stock en croissance de quelque 7 % par an. Une croissance qui diminue. Elle pourrait ne plus être que de 1 % d'ici 2100. Mais le problème est encore ailleurs. Car l'ennui, pour l'Intelligence artificielle, c'est que le stock dans lequel elle puise des informations est déjà aujourd'hui de l'ordre de 2x10¹² mots. Et sa croissance est estimée à quelque chose comme... 50 % par an.

Les choses apparaissent encore un peu plus tendues lorsque les chercheurs se penchent sur les données qualifiées de qualité. Les stocks ne seraient pas de plus de 2x10¹³ mots. Soit environ un ordre de magnitudemagnitude seulement au-dessus de ce qui alimente aujourd'hui les Intelligences artificielles comme ChatGPT.

Voir aussi

ChatGPT : la dangereuse et fascinante IA qui écrit comme les humains

Se basant sur ces tendances -- observées par le passé et projetées sur le futur --, les chercheurs estiment que la disponibilité de données pourrait devenir un facteur réellement bloquant pour le développement d'Intelligences artificielles quelque part entre 2030 et 2050. Et même dès cette année si l'on considère qu'elles doivent être nourries essentiellement de données de haute qualité. Sauf si, finalement, concernant particulièrement ChatGPT -- qui reste sur le papier, une applicationapplication de conversation --, la quantité de données de langage se révélait plus importante que sa qualité. Car alors, des données produites par des Intelligences artificielles elles-mêmes pourraient potentiellement tout à fait se substituer à celles que nous avions pris l'habitude d'être les seuls à produire...

par Nathalie Mayer

Journaliste

le 27 janvier 2023

Nos articles

Philosophie

Les secrets du langage dans le monde vivant

dossier

• 25/01/2024

La sélection de la

Article

Liens externes

Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning

À voir aussi

intelligence artificielle

intelligence artificielle danger

intelligence artificielle exemple

intelligence artificielle voiture autonome

innovation intelligence artificielle

connaissances naturalistes

strangulation perte de connaissance

connaissance soi etudes psychologie

Mots Clés

Données

Données de qualité

Apprentissage automatique

Apprentissage

Langage

Machine learning