Tech

Webfountain : la rolls des moteurs de recherche

ActualitéClassé sous :Tech , moteur , recherche

Faire en sorte que les moteurs de recherche fournissent des réponses les plus pertinentes possibles, tel est l'objectif du projet Webfountain d'IBM.

Mieux que Google ?

Localisé à l'IBM Almaden Research Center de San Jose, le projet consiste tout d'abord en un énorme complexe de processeurs, de routeurs, de disques et de logiciels occupant la superficie d'un demi-terrain de football.
Comme l'essentiel des documents publiés sur l'internet ne sont pas structurés, le système convertit tout ce qu'il parcourt en un format qui en permet l'analyse automatique. Webfountain parcours le web en une semaine, l'archive et "l'annote" avec des tags XML via plusieurs programmes spécialisés. Une fois les documents labellisés (ce qui peut multiplier leur longueur par 10), ils sont stockés dans des bases de données et soumis à des procédures de fouille de données (datamining): des procédures permettent de repérer les ambiguïtés, de chercher les liens entre les documents et les sites...

Les résultats sont alors rendus disponibles dans des bases de connaissances vendues aux clients d'IBM. Le service sera bientôt fourni par abonnement, dans un premier temps par Factiva, une société spécialisée dans la vente d'information économique.

Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour.

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !

Cela vous intéressera aussi