Sciences

Embrace : standardiser l'accès aux données bioinformatiques en Europe

ActualitéClassé sous :recherche , Embrace , réseau bioinformatique

Embrace est un projet de réseau bioinformatique européen, qui a démarré le 1er février. Doté par la commission européenne de 8,28 millions d'euros pour cinq ans, il rassemble 16 partenaires de 11 pays, dont trois équipes du CNRS. Son but : standardiser l'accès aux innombrables données issues des projets de génomique, et leurs méthodes d'étude, afin que les chercheurs puissent les consulter et les exploiter facilement.

Embrace : standardiser l'accès aux données bioinformatiques en Europe

Depuis la première ébauche du séquençage du génome humain, en 2001, les biologistes produisent toujours plus de données bioinformatiques. Pour les stocker, ils multiplient les bases de données, mais aucune standardisation n'existe encore dans ce domaine. Résultat : les données ne sont pas toutes présentées sous la même forme. En outre, les protocoles d'accès sont à chaque fois différents, de même que les algorithmes qui traitent les données brutes d'après les dernières avancées en biologie moléculaire, permettant ainsi d'identifier des gènes ou de prévoir leur fonction. En effet, la bioinformatique ne se limite pas à la conception des outils informatiques pour stocker les données biologiques : elle consiste aussi à analyser ces données.

Afin de répondre aux besoins des chercheurs en termes de stockage et de traitement de données biologiques, l'Europe a décidé de financer Embrace. Ce réseau, auquel participe le CNRS, permettra aux chercheurs de mettre eux-mêmes leurs données en commun, sous une forme standardisée, et de consulter celles de leurs confrères. À travers Embrace, ils auront également la possibilité de travailler sur ces données, grâce aux logiciels mis à leur disposition.

Embrace utilisera la "technologie de grille", où un grand nombre d'ordinateurs géographiquement éloignés les uns des autres travaillent en réseau afin d'offrir une importante capacité de stockage et de calcul. Une grille fonctionne comme un réseau électrique, qui fournit du courant à travers une prise standard : les utilisateurs n'ont pas besoin de savoir comment on produit l'électricité, ni comment on l'achemine jusqu'à la prise. Il faut juste que leur appareil puisse se brancher sur la prise. De la même manière, avec Embrace, les utilisateurs de données bioinformatiques "se brancheront" sur le site Internet de la grille, où ils seront guidés pas à pas. Ils accèderont ainsi aux dernières versions des données en toute simplicité. Les fournisseurs, moins nombreux que les utilisateurs, se chargeront de faire évoluer les standards et les fonctionnalités de la grille.

De 2001 à 2004, le projet européen Datagrid a montré la faisabilité de la technologie de grille, du point de vue de la mise en commun des ressources informatiques. Son prolongement, Egee, met aujourd'hui à la disposition de la communauté scientifique un parc d'environ 10.000 processeurs, sur plus de 80 sites en Europe. Des "logiciels de grilles" adaptés aux problématiques de la bioinformatique ont également été développée dans le cadre de ces deux projets : le CNRS a notamment mis au point le portail GPSA, dédié à l'analyse de séquences de protéines ; il s'est aussi impliqué dans plusieurs projets nationaux, dont Gripps (pour rechercher des motifs dans les séquences des protéines) et Rugbi (pour prédire la structure des protéines). Embrace profitera de l'expérience acquise lors de la mise au point de ces logiciels.

Les 16 partenaires du projet Embrace sont réparties en cinq groupes, chacun en charge d'une tâche particulière : le European Bioinformatics Institut (EBI), coordinateur d'Embrace, intégrera les bases de données et les algorithmes de référence à Embrace, afin que les biologistes puissent tout de suite commencer à s'en servir. Il s'agit par exemple de la base américaine Medline ou de la base suisse Swissprot. Le CNRS est responsable des choix et de la veille technologiques : il fera en sorte qu'Embrace bénéficie des dernières avancées en matière de grille et que les options retenues soient les mieux adaptées aux problématiques de la bioinformatique. L'Université d'Uppsala, en Suède, testera la réponse d'Embrace à des "questions typiques" : quels sont les gènes qui favorisent l'apparition des cancers ? Lors de ses mutations, le virus de l'hépatite C est-il devenu plus dangereux ? Enfin, l'Université de Nijmegen, aux Pays-Bas, coordonnera la promotion de la grille auprès des chercheurs en biologie et leur formation, pour qu'ils y intègrent leurs données.

Cela vous intéressera aussi