au sommaire
Le projet Joost fait appel à la technique de P2P pour transférer des documents vidéo payants.Crédit : Joost
Une méthode astucieuse réduit de manière spectaculaire le temps de rapatriement d'un fichier quelconque sur un réseau peer-to-peer (P2P). En gros, l'idée est d'aller chercher non seulement les fichiers répondant très exactement à la requête mais aussi, morceaux par morceaux, tous ceux qui lui ressemblent. Grâce à elle, expliquent ses inventeurs, la vitessevitesse de transfert augmente d'un facteur très variable mais oscillant entre 5 % et... 500 %.
Ce n'est pas une idée en l'airair : elle a été testée et ses promesses ont en grande partie été vérifiées. Les auteurs ne sont pas des hackers masqués mais trois chercheurs en informatique, David G. Andersen, professeur assistant à l'université Carnegie Mellon, Michael Kaminsky, de l'institut de recherche d'IntelIntel de Pittsburgh, et Himabindu Pucha, de la Purdue University. L'invention n'a pas été esquissée anonymement sur un forum de pirates. C'est au contraire l'une des attractions du quatrième Symposium sur la conception et l'installation de systèmes en réseaux (Symposium on Networked Systems Design and Implementation, NSDI'07), du 11 au 14 avril 2007 à Cambridge, dans le Massachusetts. Elle sera publiée dans les Actes du symposium.
Tant de fichiers presque identiques…
Pour élaborer leur méthode, les trois informaticiens sont partis d'un constat. Lors d'une requête sur un réseau peer-to-peer, le fichier recherché doit répondre précisément à la demande formulée. Pourtant, de nombreux fichiers ne diffèrent que très peu les uns des autres. Des versions proches d'un même logiciel, par exemple, ont de larges parties de code identiques. Des films dont la bande son a été traduite dans plusieurs langues conservent bien sûr la même séquence vidéo. Des fichiers musicaux MP3 peuvent ne différer que par les tags (étiquettes) ajoutés par l'utilisateur (l'un aura par exemple inscrit Chantons sous la pluie, l'autre Singing in the rain et un troisième rien du tout). Etc.
Or, un principe unanimement adopté par les systèmes d'échanges par peer-to-peer est de télécharger non pas des fichiers entiers mais de multiples petits morceaux trouvés en différents endroits de la planète et récupérés en parallèle pour gagner du temps. C'est ce principe que les informaticiens américains ont poussé un cran plus loin avec leur méthode SET (Similarity-Enhanced Transfer)). Sur leur réseau, les fichiers pourront être tronçonnés en morceaux, récupérés en différents endroits, comme dans le peer-to-peer traditionnel, mais aussi dans des fichiers légèrement différents. Un bout de Chantons sous la pluie sera ainsi agrégé à une partie de Singing in the rain, du moins si le reste du fichier est semblable, donc issu de la même version musicale. Pour mesurer le degré de similitude des fichiers d'origines différentes mais ayant des parties communes, l'analyse est effectuée à l'aide d'une méthode notamment utilisée pour la détection des spams. Elle tient également compte de la taille du fichier et même de la popularité du document.
La première démonstration publique a consisté à récupérer un morceau MP3 et un film (de 55 Mo). Résultat : un gain de 71 % pour le fichier musical et de 30 % pour la vidéo. Pour autant, les chercheurs disent ne pas du tout avoir l'intention de lancer un réseau pour échanger des morceaux et de musique ou des films. Mais ils pensent que les réseaux peer-to-peer ainsi améliorés pourraient servir à de multiples applicationsapplications.