Faire en sorte que les moteurs de recherche fournissent des réponses les plus pertinentes possibles, tel est l'objectif du projet Webfountain d'IBM.

au sommaire


    Mieux que Google ?

    Mieux que Google ?

    Localisé à l'IBMIBM Almaden Research Center de San Jose, le projet consiste tout d'abord en un énorme complexe de processeurs, de routeurs, de disques et de logiciels occupant la superficie d'un demi-terrain de football.
    Comme l'essentiel des documents publiés sur l'internet ne sont pas structurés, le système convertit tout ce qu'il parcourt en un format qui en permet l'analyse automatique. Webfountain parcours le web en une semaine, l'archive et "l'annote" avec des tags XML via plusieurs programmes spécialisés. Une fois les documents labellisés (ce qui peut multiplier leur longueur par 10), ils sont stockés dans des bases de donnéesbases de données et soumis à des procédures de fouille de donnéesfouille de données (datamining): des procédures permettent de repérer les ambiguïtés, de chercher les liens entre les documents et les sites...

    Les résultats sont alors rendus disponibles dans des bases de connaissances vendues aux clients d'IBM. Le service sera bientôt fourni par abonnement, dans un premier temps par Factiva, une société spécialisée dans la vente d'information économique.