GT Sophy progresse si vite qu'elle parvient désormais à battre des humains en course. © SIE
Tech

GT Sophy, l'IA qui domine les vrais pilotes sur Gran Turismo

ActualitéClassé sous :jeux vidéo , intelligence artificielle , Gran Turismo

-

À quelques semaines de la sortie de Gran Turismo, Sony a dévoilé GT Sophy, une intelligence artificielle capable de battre les meilleurs joueurs en contre la montre, puis en course. Révolutionnaire au point d'avoir droit à la Une du magazine Nature, cette IA s'appuie sur l'apprentissage par renforcement.

Cela vous intéressera aussi

[EN VIDÉO] Roborace : un tour de circuit à bord de la voiture de course autonome  Les concepteurs de la voiture de course autonome Roborace publient la première vidéo montrant une vue depuis le cockpit de leur voiture de course autonome durant un tour de circuit à haute vitesse. La compétition a eu lieu les 10 et 11 juin 2017 à Berlin, en marge d'une course de Formules E. 

Quel jeu va résister aux intelligences artificielles ? Après le go, les échecs ou encore Starcraft II, c'est désormais au tour des joueurs de Gran Turismo de s'incliner face à une IA. À quelques jours du lancement de la 7e édition de la célèbre simulation automobile de Polyphony Digital, Sony a dévoilé GT Sophy, une intelligence artificielle capable de battre les meilleurs pilotes !

En juillet, cette IA avait d'abord battu les meilleurs humains dans des courses contre la montre, c'est-à-dire qu'elle était seule en piste. Mais, en octobre, un cap a été franchi puisque GT Sophy a battu des joueurs humains sur une véritable course avec donc des dépassements sur la piste, mais aussi de la stratégie. Justement, c'est dans ce domaine que l'IA impressionne.

Valerio Gallo, l'un des meilleurs pilotes GT et champion de la Coupe des Nations des Championnats FIA GT 2021, a participé à un contre la montre contre Gran Turismo Sophy. © Sony 

Une conduite inédite

« L'IA roule d'une manière que nous n'aurions jamais imaginée », souligne ainsi Takuma Miyazono, une des références mondiales pour ce jeu vidéo. Même constat chez Kazunori Yamauchi, le créateur de Gran Turismo et directeur général du studio, Polyphony Digital, qui donne l'exemple du freinage en pleine courbe.

« En règle générale, les pilotes de course apprennent à freiner en ligne droite avec pour objectif de ralentir dans la courbe pour accélérer à la sortie du virage. GT Sophy ne fait pas nécessairement cela. Lorsqu'elle entre dans une courbe, elle freine en fait lorsqu'elle s'engage dans la courbe. Habituellement, lorsque vous entrez dans une courbe, la charge est uniquement sur les deux pneus avant ; mais avec GT Sophy, vous avez la charge répartie sur trois pneus, deux à l'avant et un à l'arrière également. Cela permet à la voiture de freiner pendant qu'elle tourne. »

Ce qui distingue cette IA des autres, c'est son type d'apprentissage. On connaissait ainsi l'apprentissage « profond », et il fait déjà partie de notre quotidien aujourd'hui dans les recherches sur Internet ou la lutte contre le spam. L'IA est entraîné avec des millions d'exemples, et elle est ensuite capable d'être autonome pour trouver des images similaires ou éliminer le spam dans nos e-mails. GT Sophy y a eu droit avec plus de 45.000 heures d'apprentissage, basées sur des années de jeux et stockées sur un millier de PlayStation !

Mille PS4 ont été utilisées pour former GT Sophy. © Sony

La puissance de l'apprentissage par renforcement

Pour compléter ce machine learning qui est très brut, Sony a opté pour l'apprentissage par renforcement (reinforcement learning). C'est un type d'apprentissage automatique utilisé pour former des IA à prendre des décisions dans un environnement avec un système de récompenses ou de pénalités pour chaque action en fonction des résultats auxquels elles conduisent. Cette méthode appliquée à la simulation sportive est si pertinente et pointue qu'elle a droit cette semaine à un article et même la couverture du prestigieux magazine Nature.

Le schéma ci-dessous montre comment une IA interagit avec son environnement. Elle entreprend une action dans le monde, reçoit une récompense (ou une pénalité) et une description mise à jour de l'état du monde pour déterminer sa prochaine action. Appliqué à la course automobile, il s'agit de réagir aux manœuvres des adversaires, mais aussi aux modifications de la piste. La difficulté était de prendre conscience des règles non écrites de la course automobile, comme éviter les collisions et ne pas couper les virages de manière dangereuse.

Pour défier GT Sophy, il faudra hélas patienter puisqu'elle ne sera pas incluse dans Gran Turismo 7, mais via une mise à jour ultérieure. Selon les pilotes chevronnés qui l'ont testée, son point fort tient dans sa capacité à avoir une conduite « humaine ». À aucun moment, ils n'ont eu le sentiment de défier un ordinateur dont le pilotage est habituellement très mécanique et prévisible.

À chaque freinage ou accélération, l'IA modifie son environnement, et l’apprentissage par renforcement lui permet d'apprendre de ses propres erreurs pour ne pas les répéter. © Sony
Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour. Toutes nos lettres d’information

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !