Nuance, le spécialiste de la reconnaissance vocale, travaille avec des fabricants de puces pour solliciter l’assistant vocal d’un smartphone sans avoir à le toucher et même s’il est en veille. Vlad Sejnoha, directeur technique de Nuance Communications, a répondu aux questions de Futura-Sciences.

au sommaire


    Il n'est peut-être pas si loin le temps où l'on pourra donner des ordres à son smartphone sans même avoir à le prendre en main. Nuance Communications, l'une des entreprises les plus en pointe dans le domaine de la reconnaissance vocale, vient de confirmer qu'elle travaille avec des fabricants de puces pour mobiles afin de concevoir un processeur capable d'activer l'assistant vocal d’un smartphone en toute circonstance et sur simple commande vocale de son propriétaire.

    L'objectif est de supprimer les étapes aujourd'hui nécessaires pour utiliser un assistant vocal afin de se rapprocher d'une interaction la plus naturelle possible. On pourra ainsi s'adresser directement à son smartphone pour lui demander d'exécuter une action (appeler un contact, envoyer un e-mail, écouter ses messages, lancer une recherche sur Internet, etc.) sans avoir à le prendre en main pour activer l'assistant vocal et même s'il est en veille. « Cette fonctionnalité fait partie de notre vision depuis un long moment et nous avons fait des progrès réguliers sur les technologies sous-jacentes, mais la collaboration [avec les fabricants de puces, NDLRNDLRa vraiment débuté depuis à peu près un an », a expliqué à Futura-Sciences Vlad Sejnoha, le directeur technique de Nuance Communications. « Je pense que la prise de conscience du fait que la reconnaissance vocale et du langage naturel va devenir partie intégrante des interfaces utilisateurs et que cela est accueilli avec enthousiasme par les usagers, a poussé les fabricants de puces et de terminaux à accélérer leurs efforts pour optimiser leurs plateformes en conséquence », ajoute-t-il.

    Selon Vlad Sejnoha, le directeur technique de Nuance, il faut compter 1 à 2 ans pour voir arriver des assistants vocaux répondant même en veille. © Nuance

    Selon Vlad Sejnoha, le directeur technique de Nuance, il faut compter 1 à 2 ans pour voir arriver des assistants vocaux répondant même en veille. © Nuance 

    Même si cela n'a jamais été rendu officiel, beaucoup de spécialistes pensent que cette entreprise américaine est à l'origine de la technologie de l'assistant vocal d'AppleApple nommé Siri. 

    Assistant vocal : combiner performance et consommation

    Mais pour arriver à un assistant vocal capable d'entendre une commande et d'agir dans la foulée même si le mobile est en veille, il reste un certain nombre d'obstacles à franchir. Il faut commencer par mettre au point une architecture matérielle dont une partie peut rester active en permanence tout en consommant le moins d'énergieénergie possible pour ne pas vider la batterie de façon prématurée. Mais il faut dans le même temps que la puissance de calcul allouée soit suffisante pour détecter un « évènement intéressant » explique le directeur technique de Nuance. « Si un évènement intéressant est détecté, le système doit pouvoir ensuite solliciter un peu plus de puissance de calcul pour en confirmer la pertinence puis effectuer l'interprétation adéquate de la commande. »

    Selon Vlad Sejnoha, l'objectif est de trouver le bon compromis entre la consommation d'énergie et le niveau de précision de la réaction du système lors d'une entrée détectée comme pertinente. Et ce n'est pas tout. « Le deuxième défi est d'exécuter un traitement du signal sophistiqué en éliminant le bruit et les interférencesinterférences, là encore de la manière la moins énergivore. Il s'agit d'un point crucial dans le scénario d'utilisation car il faut envisager le fait que la personne n'ait pas le terminal en main lorsqu'elle lui parlera », poursuit-il.

    Pour cela, Vlad Sejnoha nous a confié que Nuance travaille également sur l'intégration de multiples microphones dans les terminaux de manière à assurer une couverture multidirectionnelle susceptible de localiser l'utilisateur principal et d'éliminer les signaux parasitesparasites. « Nous appliquons ensuite l'identification vocale au traitement du signal afin de nous assurer que le terminal prenne ses commandes de la bonne source, à savoir son propriétaire ». Beaucoup de travail en perspective donc, mais les choses pourraient aller relativement vite. « Des assistants vocaux capables en une fois de détecter une commande et d'agir alors qu'ils sont en veille tout en incorporant des technologies préservant l'autonomie apparaîtront probablement d'ici 1 à 2 ans. »