Identifier un visage parmi 36 millions en une seule seconde à partir d’un réseau de caméras de vidéosurveillance ou d'une simple photo, c’est la prouesse à laquelle est parvenu Hitachi Kokusai Electric. Pour aller aussi vite, le système de reconnaissance faciale analyse les images en temps réel. Il présente toutefois quelques limites.

au sommaire


    Depuis maintenant cinq ans, pratiquement n'importe quel appareil photo numérique compact grand public sait analyser une scène et y détecter un visage en une fraction de seconde pour réaliser automatiquement la mise au point. Hitachi Kokusai Electric a poussé le concept plus loin en mettant au point un système de vidéosurveillance capable d'identifier un visage dans une foule pour suivre l'individu en question en temps réel. La performance annoncée est surprenante : il ne faudrait qu'une seconde pour identifier un visage parmi 36 millions à partir d'une photo ou d'une autre caméra de surveillance !

    En pratique, le fonctionnement est le suivant. L'agent d'un centre de vidéosurveillance ou le policier sélectionne le visage d'une personne sur une vidéo provenant d'une caméra de vidéosurveillance ou d'une photo. À partir de cette source, toutes les images supposées du suspect, filmées par l'ensemble du système de vidéosurveillance, sont délivrées instantanément à l'opérateur sous la forme de vignettes.

    Une reconnaissance faciale en temps réel

    Lorsqu'une de ces miniatures est choisie, la vidéo de la caméra de surveillance d'où elle provient peut être consultée pour visionner les actions passées ou présentes et filer éventuellement l'individu en question. Le système fonctionne également lorsqu'on lui présente un portrait provenant d'un réseau social, comme Facebook.


    Présenté lors du salon Security Show au Japon, le système de reconnaissance faciale développé par Hitachi permet de trouver quasiment instantanément un visage dans une foule filmée pendant des heures par des caméras de vidéosurveillance. Pour obtenir les sous-titres, cliquez sur cc puis sélectionnez la langue française. © Diginfo.tv/YouTube

    Contrairement aux systèmes actuels qui réalisent un traitement à postériori pour générer la reconnaissance faciale, la technique d'Hitachi effectue cette analyse en temps réel et en permanence. Le constructeur n'a pas dévoilé les caractéristiques de son procédé, mais a avoué qu'il souffre de deux grandes contraintes.

    Quelques contraintes de taille...

    Premier frein, les visages doivent mesurer 40 x 40 pixels pour être détectés. Second écueil, le système ne peut repérer les visages que s'ils ont un angle maximal de 30° verticalement et horizontalement par rapport à la caméra. De manière générale, la détection faciale pose problème lorsque l'individu est positionné de profil ou de semi-profil devant la caméra. Et il y a également les inévitables variations de la luminosité qui dégradent fortement l'image analysée. Si elle est efficace en raison de sa rapidité, la solution du constructeur n'est pas pour autant infaillible.

    Pour plus de précision, il faudrait, en effet, passer à la 3D. Mais voilà... contrairement à l'image plane en 2D, la 3D suppose un système d'acquisition d'images en stéréovision, impliquant au moins deux caméras de façon à reconstruire en volumevolume les traits marquant du visage (forme des orbitesorbites, neznez, menton). Des recherches sont menées en ce sens par le CNRS depuis plusieurs années. Comme candidat potentiel, le fameux Kinect de MicrosoftMicrosoft pourrait bien alors se transformer en un redoutable outil de vidéosurveillance.

    En attendant, Hitachi Kokusai Electric pense commercialiser son dispositif au seul secteur de la vidéosurveillance d'ici un an. Dans son communiqué de presse le constructeur évoque notamment la mise en place de solutions sur mesure pour les domaines des chemins de ferfer, des centrales électronucléaires et des grandes surfaces.