Plusieurs initiatives récentes visent à rendre les liens hypertextes - ou plus généralement les informations publiées en ligne - plus "signifiants", par l'ajout de balises spécifiques (tags) lisibles par les robots d'indexation.

au sommaire


    Ce mouvementmouvement a peut-être été initié par Flickr, un service de partage de photos en ligne, qui permet aux auteurs des images de leur associer des notes ou des tags. Chaque photo peut ainsi être annotée, entièrement ou en partie, et le service tient ensuite à jour une liste des 150 tags les plus populaires, auxquels sont rattachées des images de toutes provenances.

    Ce procédé a également été retenu par Technorati, l'un des plus gros moteurs d'indexation de blogs (plus de six millions de blogs indexés) qui a créé récemment une section "tags". Le principe est proche de celui de Flickr : les blogueurs peuvent placer dans leurs billets des liens spécifiques, de forme habituelle mais comportant des mots-clés. En parcourant les blogs, Technorati lit ces balises et agrège automatiquement les billets portant sur des sujets similaires, dans les listes thématiques. La même page thématique comprend les billets taggés par les blogueurs, les images provenant de Flickr et comportant le même tag, mais aussi les liens émanant de deux autres outils, destinés au partage de liens, Furl et deldel.icio.us. Ainsi, par exemple, la page relative au tag "Science" de Technorati, mise à jour en permanence, comporte des liens vers des billets, des photos et des adresses web qui sont tous en rapport direct avec le sujet.

    Enfin, un autre tag fait beaucoup parler de lui depuis quelques temps : le tag "nofollow", proposé par GoogleGoogle pour lutter contre le spam de commentaires sur les blogs. Ces derniers sont en effet des victimes de choix des robots-spammeurs, qui parcourent les billets publiés pour y laisser de faux commentaires, assortis de liens vers des sites commerciaux. Le procédé vise à augmenter le classement de ces sites dans Google. La solution proposée consiste à ajouter de façon automatique une balise à tous les liens qui ne sont pas publiés par le blogueur lui-même sur son blog. Ainsi, un lien au sein d'un billet sera indexé normalement par Google, tandis qu'un lien figurant au sein d'un commentaire, forcément marqué "nofollow", ne sera pas "suivi" par le moteur qui ne le prendra donc pas en compte dans son index. Le procédé, déjà soutenu par plusieurs moteurs (notamment Yahoo) et surtout par les éditeurs d'outils de publication de blogs, qui l'incorporeront par défaut dans leurs logiciels, ne fait pourtant pas l'unanimité parmi les blogueurs, qui soulignent que la solution ne lutte pas directement contre le spam de commentaires. Le but est en effet davantage de dissuader les spammeurs, en leur signifiant que leur action n'aura plus d'effet sur leur PageRank dans Google, que de les empêcher de polluer.

    Globalement, on peut néanmoins voir dans ces démarches une forme d'évolution, dont les effets pourraient ne pas être négligeables. D'une part ces nouveaux tags vont dans le sens de la sémantisation du web et des liens hypertexte. Le tag "nofollow" est ainsi une première, puisqu'il instaure une hiérarchie entre les liens hypertexte, séparant ceux choisis par l'éditeur d'un site et ceux publiés par des tiers. D'autre part, la démarche initiée par Technorati et les autres outils de partage d'information s'inscrit dans un mouvement plus global qui vise à organiser de façon thématique, automatique et collective, les informations publiées sur le web et dans la blogosphèreblogosphère.