Un consortium européen de neuf partenaires issus d'universités et d'entreprises met actuellement au point une architecture poste à poste répartie à grande échelle qui permettra de rechercher un contenu audiovisuel au moyen du paradigme de l'interrogation par l'exemple (Query By Example).

au sommaire


    SAPIR : un nouveau moteur de recherche multimédia, après Quaero et Theseus

    SAPIR : un nouveau moteur de recherche multimédia, après Quaero et Theseus

    Dans ce paradigme, un extrait musical sert de requête et le résultat est une liste d'autres extraits musicaux classés en fonction de la similitude de leur contenu.

    Baptisé SAPIR, pour « Contenu audiovisuel utilisant la récupération d'information poste à poste », ce projet d'une valeur de 3,8 millions d'euros est financé au titre du sixième programme-cadre (6e PC) et implique la constitution d'une communauté d'information de grande envergure qui renforcera l'accessibilité du multimédia.

    « À ce jour, les moteurs de recherche populaires fonctionnent à l'intérieur de limites définies », a expliqué Yosi Mass, responsable du projet SAPIR au laboratoire de recherche IBMIBM d'Haïfa (Israël).

    « SAPIR a pour objectif de créer un immense réseau poste à poste, dans lequel chaque utilisateur représente un poste qui produit un contenu audiovisuel à l'aide de multiples dispositifs et les fournisseurs de services jouent le rôle de postes supérieurs qui gèrent des index et offrent des capacités de recherche », a-t-il ajouté.

    En tant que moteur de recherche de contenu audio/visuel, SAPIR entend étudier de nouveaux procédés pour analyser, indexer et récupérer les vastes quantités de paroles, d'images, de vidéos et de musiques qui fourmillent dans l'universunivers numérique.

    « Afin de définir de nouvelles normes dans les méthodes de recherche, SAPIR intégrera des technologies telles que la reconnaissance vocale, le traitement d'images, des algorithmes d'indexation, des mécanismes de classement sophistiqués et une recherche réelle dans les contenus audiovisuels. À la différence des requêtes sur une base de texte, un utilisateur pourra, grâce à l'interrogation par l'exemple, prononcer un mot à voix haute et demander au moteur de rechercher une séquence similaire. Dans un autre scénario, il pourra introduire la photo d'un saxophone et lui demander de rechercher des formes similaires », a affirmé M. Mass.

    Le résultat final prendra la forme d'un espace réparti poste à poste qui pourra être interrogé à partir d'un contenu ou d'un exemple au lieu d'employer les méthodes actuelles, qui se limitent à des mots-clés et à des balises textuelles.

    « SAPIR s'attaque à certains défis parmi les plus passionnants à l'heure actuelle dans le domaine de la recherche, à commencer par l'ampleur des informations concernées. Le terrain de recherche que constituent les volumesvolumes considérables de fichiers vidéo et multimédia en circulation dépasse largement l'étendue couverte par les principaux moteurs actuels. La popularité de nouveaux sites vidéo atteste clairement de la nécessité fondamentale de la recherche multimédia à ce jour. Eu égard à leur ampleur, ces données ne peuvent plus être traitées par le modèle prévalant de consultation et d'indexation centralisées de l'ensemble du contenu susceptible d'être recherché », a commenté M. Mass.

    Le consortium SAPIR réunit des experts du monde industriel et universitaire, qui apportent chacun leur savoir-faire sur les dispositifs multimodaux, la récupération d'informations, l'indexation, la répartition poste à poste, l'analyse audiovisuelle et la mise en réseau sociale.

    « La recherche hautement extensible d'informations riches en médias reste aujourd'hui un espace ouvert. L'une des clés pour procurer aux utilisateurs une expérience globale de recherche consiste à repousser les limites actuelles de la recherche textuelle et de l'espace de recherche confiné », conclut M. Mass.

    Le projet SAPIR appartient en fait à une série d'initiatives européennes lancées pour concevoir un moteur de recherche de nouvelle génération à même de rivaliser avec le moteur de recherche le plus populaire au monde, GoogleGoogle, et son concurrent direct, Yahoo!.

    Un projet français, dénommé « Quaero » d'après le latin « je cherche », a débuté en 2005 dans le but de donner aux Européens un outil de recherche plus local pour le contenu multimédia. En parallèle, un projet allemand, baptisé « Theseus » en référence au roi mythologique d'Athènes qui a réussi à retrouver son chemin dans le labyrinthe du Minotaure, adopte une approche différente en se concentrant sur les recherches textuelles.

    On ignore encore si le moteur de recherche gagnant sera américain ou européen et s'il s'articulera autour de la recherche textuelle ou multimédia, mais la compétition dans ce domaine d'innovation pourrait donner lieu à l'un des spectacles les plus passionnants de la décennie dans les technologies de l'information et de la communication.