au sommaire


    Les humains ont un système de vocalisations complexe. Celles-ci sont digitales et compositionnelles : elles sont construites à partir de la recombinaison d'unités qui sont systématiquement réutilisées dans les vocalisations. Ces unités sont présentes à plusieurs niveaux (les gestes, les coordinations de gestes ou phonèmesphonèmes, les morphèmes). Il y a par ailleurs une grande diversité des langues dans le monde.

    La robotique peut-elle aider à découvrir les interactions du langage et mieux comprendre les vocalisations et langues du monde ? © Ociacia, Shutterstock
    La robotique peut-elle aider à découvrir les interactions du langage et mieux comprendre les vocalisations et langues du monde ? © Ociacia, Shutterstock

    Espace articulatoire et langues du monde

    Alors que l'espace articulatoire qui définit l'espace des gestes est continu, chaque langue discrétise cet espace à sa manière. Alors qu'il y a une grande diversité dans l'ensemble des répertoires de ces unités dans les langues du monde, il y a en même temps de fortes régularités (par exemple, la fréquence élevée du système à cinq voyelles /e,i,o,a,u/).

    L'oreille est l'outil qui nous permet de « mesurer » la parole. Cependant, notre perception de la parole ne correspond pas directement aux mesures fournies par l'oreille : en effet, le cerveau effectue un certain nombre de traitements de ce signal, dont certains sont le résultat d'un apprentissage culturel. C'est pourquoi des personnes parlant des langues différentes peuvent percevoir le même son de manière très différente. Par exemple, les Japonais ne perçoivent pas la différence entre le l de <em>lead</em> en anglais, et le r de <em>read</em>. © DR
    L'oreille est l'outil qui nous permet de « mesurer » la parole. Cependant, notre perception de la parole ne correspond pas directement aux mesures fournies par l'oreille : en effet, le cerveau effectue un certain nombre de traitements de ce signal, dont certains sont le résultat d'un apprentissage culturel. C'est pourquoi des personnes parlant des langues différentes peuvent percevoir le même son de manière très différente. Par exemple, les Japonais ne perçoivent pas la différence entre le l de lead en anglais, et le r de read. © DR

    Combinaison des unités de vocalisation : phonèmes, syllabes, patterns…

    La manière dont les unités sont combinées est aussi très particulière :

    • toutes les séquences de phonèmes ne sont pas autorisées dans une langue donnée ;
    • l'ensemble des combinaisons de phonèmes est organisé en patterns. Cette organisation en patterns veut dire que, par exemple, on peut résumer les combinaisons de phonèmes autorisées en Japonais pour former des syllabes (« moras » plus exactement) par les patterns « CV/CVCCVC/VC », où par exemple « CV » est un pattern qui désigne les syllabes composées de deux emplacements, avec dans le premier emplacement uniquement des phonèmes de la catégorie que l'on appelle « consonnes », alors que dans le second emplacement, seuls les phonèmes de la catégorie « voyelles » sont autorisés.
    Les vocalisations sont produites par des mouvements des organes articulateurs, et sont donc physiquement définies dans un espace moteur continu. Cependant, chaque langue discrétise cet espace à sa manière. (Cliquez sur l'image pour l'agrandir.) © DR
    Les vocalisations sont produites par des mouvements des organes articulateurs, et sont donc physiquement définies dans un espace moteur continu. Cependant, chaque langue discrétise cet espace à sa manière. (Cliquez sur l'image pour l'agrandir.) © DR

    Des combinaisons propres à chaque langue

    En outre, il faut remarquer que la parole est un code conventionnel. Alors qu'il y a des régularités statistiques au travers des langues humaines, chaque communauté linguistique possède sa propre manière de catégoriser les sons, et son propre répertoire de règles de combinaisons de ces sons. Par exemple, les Japonais n'entendent pas la différence entre le r de read et le l de lead, en anglais. Comment alors une communauté linguistique en arrive-t-elle à former un code qui est partagé par tous ses membres, sans qu'il n'y ait de contrôle supervisé global ?

    Il est vrai, par exemple, que depuis les travaux de Boer (2001) ou Kaplan (2001), on sait comment un nouveau son ou un nouveau mot peut se propager et être accepté dans une population donnée. Cependant, ces mécanismes de négociation, encore appelés « de dynamique du consensus », font appel à la préexistence de conventions et d'interactions linguistiques. Ils concernent donc plutôt l'évolution des langues, mais ne proposent pas de solution quant à l'origine du langage.

    En effet, quand il n'y avait pas déjà de systèmes de communication conventionnels, comment sont apparues les premières conventions de la parole ?