Jean Véronis, chercheur à l'université de Provence et directeur du Cilsh (Centre informatique pour les lettres et sciences humaines), dissecte sur son excellent blog, les technologies du langage.

au sommaire


    PageRank - Référencement : comment pondérer la notoriété ?

    PageRank - Référencement : comment pondérer la notoriété ?

    Suite à un référencement automatique de GoogleGoogle qui place son carnet web en tête des requêtes sur l'expression anecdotique "VernisVernis à ongleongle", Jean Véronis, non seulement nous explique pourquoi, mais donne les bases de ce qui pourrait permettre de pondérer le principe de notoriété (PageRank) de Google :

    "On voit mal comment remplacer le principe de notoriété, qui restera sans doute longtemps, sous une forme ou une autre, la base des classements de résultats. Cependant, il devrait être pondéré par une analyse minimale des sites. A l'heure actuelle, les critères internes aux sites sont extrêmement minimes (pondération du titre, évaluation globale de la quantité de contenu pour combattre les spams, par exemple).

    Bien sûr, des traitements sémantiques très compliqués peuvent être envisagés, mais des outils de statistique lexicale extrêmement rustiques pourraient déjà permettre une amélioration considérable des résultats. Sur ce blog par exemple, un classement trivial des mots par fréquence ferait immédiatement apparaître que vernis et ongles n'ont eu que des mentions marginales, et ne doivent donc pas faire remonter le site sur ces requêtes. A mon avis, c'est le traitement linguistique (même minimal) du contenu des sites qui permettra le prochain saut quantique dans l'universunivers des moteurs de recherche."