Tech

Sciences du langage, mathématiques, informatique et robotique : quels liens ?

Dossier - Langage : des robots pour comprendre l'origine de la parole
DossierClassé sous :robotique , technologie , origine de la parole

Il y a très longtemps, les humains ne produisaient que des grognements inarticulés. La question de savoir comment ils en sont venus à parler est l'une des interrogations les plus difficiles qui soient posées à la science. La robotique peut nous aider à mieux comprendre le langage et les origines de la parole. Un voyage fascinant.

  
DossiersLangage : des robots pour comprendre l'origine de la parole
 

En plus des linguistes, des psychologues, des anthropologues, des chercheurs en neurosciences, des généticiens et des physiologistes, les mathématiciens et les informaticiens-roboticiens jouent désormais un rôle crucial dans la recherche des origines du langage.

Il existe un lien entre les sciences du langage, les mathématiques, l'informatique et la robotique. Ici, un spectrogramme de la voie humaine. © Dvortgirl, Mysid, CC by-nc 3.0

Il existe un lien entre les sciences du langage, les mathématiques, l'informatique et la robotique. Ici, un spectrogramme de la voie humaine. © Dvortgirl, Mysid, CC by-nc 3.0

Le langage et les modèles opérationnels

Les mathématiciens et les informaticiens-roboticiens disposent d'outils nouveaux et indispensables pour nous permettre de comprendre les phénomènes d'auto-organisation dans les systèmes complexes. Ils construisent des modèles opérationnels des interactions entre les sous-systèmes impliqués dans le langage.

Un modèle opérationnel est un système qui définit formellement l'ensemble de ses présuppositions et, surtout, qui permet de calculer ses conséquences, c'est-à-dire de prouver qu'il mène à un ensemble de conclusions données.

Les origines du langage sont une énigme pour les scientifiques. © DR

Langage, équations mathématiques et intelligence artificielle

Il existe deux grands types de modèles opérationnels :

  • Le premier, celui utilisé par les mathématiciens et certains biologistes théoriciens, consiste à abstraire du phénomène du langage un certain nombre de variables ainsi que leurs lois d'évolution sous la forme d'équations mathématiques. Cela ressemble le plus souvent à des systèmes d'équations différentielles couplées, et bénéficie du cadre de la théorie des systèmes dynamiques ;
  • Le second type, qui permet de modéliser des phénomènes plus complexes que le premier, est celui utilisé par les chercheurs en intelligence artificielle : il consiste à construire des systèmes artificiels implantés dans des ordinateurs ou sur des robots. Ces systèmes artificiels sont composés de programmes qui, le plus souvent, prennent la forme d'agents artificiels, qu'on pourra appeler robots même s'ils évoluent dans des environnements virtuels, dotés de cerveaux et de corps artificiels. Ceux-ci sont alors mis en interaction dans un environnement artificiel ou réel, et on peut étudier leur dynamique. C'est ce qu'on appelle la « méthode de l'artificiel » (Steels, 1997).
La méthode de l'artificiel a déjà fait ses preuves dans de nombreux domaines de recherche. Elle a par exemple permis de comprendre comment les structures sociales et les structures architecturales qui caractérisent les sociétés d'insectes comme les abeilles ont pu se former. Ici, on montre en haut une photographie de la distribution des œufs, du pollen et du miel à l'intérieur d'une ruche. Des chercheurs ont construit des systèmes artificiels simulant l'auto-organisation de cette structure, comme on le montre sur la figure du bas. © Self-Organization in Biological Systems, Camazine et al., Princeton University Press

La construction de systèmes artificiels dans le cadre de la recherche sur les origines du langage et de l'évolution des langues bénéficie d'une popularité grandissante dans la communauté scientifique en tant qu'outil pour étudier les phénomènes du langage liés à l'interaction complexe de ses composants.

La méthodologie de l'artificiel

Il y a deux grands types d'utilisation de ces systèmes :

  • évaluer la cohérence interne des théories verbales déjà proposées en clarifiant toutes les hypothèses et en vérifiant qu'elles mènent bien aux conclusions proposées (et bien souvent on découvre des failles dans les présuppositions ainsi que dans les conclusions qui doivent être révisées) ;
  • explorer et générer de nouvelles théories, qui souvent apparaissent d'elles-mêmes quand on essaie tout simplement de construire un système artificiel qui reproduit les comportements de parole des humains. Un certain nombre de résultats décisifs ont déjà été obtenus et ont permis d'ouvrir la voie à la résolution de questions jusque-là sans réponses : la génération décentralisée de conventions lexicales et sémantiques dans des communautés de robots (Steels, 1997 ; Kaplan, 2001).

L'expérience des « Talking Heads »

Les « Talking Heads » (1999), ou la formation culturelle de répertoires lexicaux. © DR

Cette seconde utilisation a fourni des résultats avec, par exemple, l'expérience des « Talking Heads » illustrée ci-dessus, la formation de répertoires partagés de voyelles ou de syllabes dans des sociétés d'agents, avec des propriétés de régularités structurelles qui ressemblent beaucoup à celles des langues humaines (de Boer, 2001 ; Oudeyer, 2001).

L'expérience « Maïdo et Gurby »

C'est également le cas avec l'expérience intitulée « Maïdo et Gurby », illustrée ci-dessous, mais aussi avec la formation de structures syntaxiques conventionnalisées (Batali, 1998) ou les conditions dans lesquelles la compositionnalité peut être sélectionnée (Kirby, 1998).

« Maïdo et Gurby » (2001), ou la formation culturelle de répertoires sonores. © DR

Systèmes artificiels et explication du langage

Il est important de noter que cette méthodologie de l'artificiel, dans le cadre de la recherche sur les origines du langage, est avant tout une méthodologie exploratoire. Elle s'insère dans une logique scientifique d'abduction. Le mot « modèle », qui est souvent employé dans la littérature sur les origines du langage pour décrire les systèmes artificiels, a un sens différent de son acceptation traditionnelle.

C'est pourquoi d'ailleurs, il est tout simplement préférable d'employer l'expression « système artificiel ». En effet, il ne s'agit pas d'observer un phénomène naturel et d'essayer d'en abstraire les mécanismes et les variables fondamentaux pour construire un modèle qui soit capable de prédire précisément la réalité. Il s'agit plutôt de s'interroger qualitativement sur les types de mécanismes que la nature a pu mettre en œuvre pour résoudre tel ou tel problème. En effet, le langage est un phénomène tellement complexe que la simple observation ne permet pas de déduire des mécanismes explicatifs.

Au contraire, il est nécessaire d'avoir au préalable une bonne conceptualisation de l'espace des mécanismes et des hypothèses qui pourraient expliquer les phénomènes complexes du langage. Et c'est là le rôle de la construction de système artificiel : développer notre intuition sur les dynamiques de formation du langage et ébaucher l'espace des hypothèses. Il ne s'agit donc pas d'établir directement la liste des mécanismes responsables de l'origine de tel ou tel aspect du langage. L'objectif est plus modestement d'essayer de faire une liste des candidats possibles, de contraindre l'espace des hypothèses, en particulier en montrant des exemples de mécanismes qui sont suffisants et des exemples de mécanismes qui ne sont pas nécessaires.

Pour que cela ne reste pas abstrait, je vais maintenant détailler les grandes lignes d'un exemple de système artificiel construit dans le but de faire progresser la réflexion et la conceptualisation des origines du langage. Cet exemple, sur lequel j'ai travaillé pendant plusieurs années, ne s'attaque pas au problème de l'origine du langage dans sa généralité, mais plutôt à la question de l'origine de l'un de ses composants essentiels : la parole, c'est-à-dire les systèmes de sons, véhicules et supports physiques du langage (au même titre par exemple que les signes visuels dans les langues des signes).