La recherche sur Google est plus efficace depuis quelques jours... L'algorithme s'essaie au sémantique en élargissant le champ de recherche par ajout de mots clés associés et en analysant les expressions de plus de trois mots clés.

au sommaire


    Tapez « cellules souchescellules souches » dans GoogleGoogle et descendez la page. Une rubrique Recherches apparentées propose de poursuivre l'exploration avec d'autres mots clés : cellules souches embryonnairescellules souches embryonnaires, cordon ombilicalcordon ombilical, moelle osseusemoelle osseuse, ParkinsonParkinson, clonageclonage, etc. Cette ouverture supplémentaire n'est pas un mince progrès. Elle implique que le moteur de recherche utilise des associations de mots clés.

    Google a apporté une seconde amélioration concernant les requêtes à plus de trois mots clés. Jusque-là, les résultats étaient très décevants car tous les termes n'étaient systématiquement utilisés. Aujourd'hui, le moteur cherche à les prendre en compte et même à analyser le sens de l'expression. Avec cette logique, la requête « Quel est le volumevolume de JupiterJupiter » renvoie des liens vers des sites apportant précisément cette réponse.

    Enfin presque... Selon le blog de Google, ces raffinements sont déjà disponibles pour 37 langues. Mais force est de constater que ces nouvelles fonctions préfèrent pour le moment Shakespeare à Molière. Pour illustrer la première de ces deux améliorations, les auteurs du post (Ori Allon et Ken Wilder) prennent l'exemple de « principles of physics » qui renvoie, comme recherches apparentées, physique quantiquephysique quantique, principe de la relativité, mécanique, chimiechimie... En revanche, une recherche sur « principes de physique » ne donne aucun mot clé supplémentaire.

    En bas de la page des réponses à une requête sur le moteur de recherche de Google apparaît parfois une nouvelle rubrique, <em>Recherche apparentées</em>, avec une proposition de mots clés supplémentaires. (Cliquer sur l'image pour l'agrandir.)
    En bas de la page des réponses à une requête sur le moteur de recherche de Google apparaît parfois une nouvelle rubrique, Recherche apparentées, avec une proposition de mots clés supplémentaires. (Cliquer sur l'image pour l'agrandir.)

    Les questions en langage naturel, saint Graal du Web

    De même, pour le volume de Jupiter, mieux vaut taper « what is the volume of Jupiter » pour bénéficier des améliorations apportées. Google n'expliquant rien des méthodes employées, on ne peut que supposer une possible amélioration avec le temps, au fil des requêtes des internautes.

    Ce progrès s'inscrit dans une tendance forte, celle du Web sémantique, décrit notamment par Tim Berners-Lee. L'espoir est de mettre au point des moteurs de recherche capables d'extraire le sens d'une phrase. En 2008, MicrosoftMicrosoft a dépensé cent millions de dollars pour s'offrir PowerSet, une petite entreprise qui a mis au point un outil de recherche acceptant des questions en langage naturel (en anglais) mais limité aux pages de Wikipedia.

    Dans cette veine, on attend avec impatience, en principe au mois de mai, la merveille des merveilles, baptisée Wolfram Alpha, créée par Stephen Wolfram (le père du logiciel Mathematica). Selon les informations qui ont filtré, à une question posée, cet outil renverra une ou plusieurs réponses plutôt que des liens vers des pages Web.