100 milliards de bases dans les banques de données sur l'ADN et l'ARN

Recherche

Séquençage de l'ADN

Génome

actualité

• 3 Min

Les trois membres du projet de base de données internationale de séquences de nucléotides (International Nucleotide Sequence Database Collaboration - INSDC) ont annoncé que leurs répertoires publics d'informations sur les séquences de l'ADN et de l'ARN contiennent désormais plus de 55 millions de séquences, soit l'équivalent de 100 gigabases, ou 100.000.000.000 bases - les composantes moléculaires de l'ADN qui codifient les informations génétiques.

au sommaire

ADN (modèle moléculaire)

Les trois membres - EMBL-Bank (basée au laboratoire européen de biologie moléculairebiologie moléculaire de l'Institut européen de bioinformatique de Hinxton, Royaume-Uni), GenBank (Etats-Unis) et la Banque de données japonaise sur l'ADN - ont atteint ensemble cette étape clé grâce à leur politique d'échange de données. Les trois organisations partagent leurs données séquentielles moyennant l'échange global d'informations biologiques pour mettre le plus vite possible à la libre disposition de la communauté scientifique toute séquence de nucléotidesnucléotides du domaine public.

Quatre bases - l'adénineadénine (A), la thyminethymine (T), la guanineguanine (G) et la cytosinecytosine (C) - reliées ensemble par paires forment une longue chaîne pour constituer la double hélice désormais familière de l'acide désoxyribonucléiqueacide désoxyribonucléique (ADN). Les liens entre les paires de base - A étant reliée à T et C à G via des liaisons hydrogénées - peuvent être rompus pour "délier" les deux brins de la double hélice.

Les informations génétiquesgénétiques sont encodées dans l'ADN dans l'ordre où les bases se présentent en séquence. De manière conventionnelle, les séquences peuvent être décrites simplement en énumérant l'ordre des bases individuelles (ou nucléotides) de l'une des deux brins (par ex. CCAAATATGGATT), ceci constituant, avec les annotations identifiant les espècesespèces et les fonctions sources, le type d'informations que contiennent les bases de donnéesbases de données INSDC.

"Il s'agit d'une étape clé de l'histoire des bases de données de séquences de nucléotides, a déclaré Graham Cameron, directeur associé de l'Institut européen de bioinformatique EMBL. Depuis la première donnée enregistrée dans la bibliothèque de données EMBL rendue publique en 1982 jusqu'à la mise à disposition, aujourd'hui, de plus de 55 millions de séquences d'au moins 200.000 organismes différents, ces ressources ont anticipé les besoins des biologistes moléculaires et y ont répondu, souvent dans le contexte d'un grave manque de ressources".

Le projet INSC a été formalisé en février 1987 et les trois bases de données se sont développées dans les années 80: EMBL-Bank, localisée aujourd'hui à l'EBI au Royaume-Uni, a été créée sous le nom de EMBL Data Library à Heidelberg (Allemagne) ; la GenBank américaine a été créée peu de temps après au laboratoire national de Los Alamos, avant d'être déplacée au centre national d'informations biotechnologiques de Bethesda (Etats-Unis); la Banque de données japonaise sur l'ADN a quant à elle été établie à l'institut national de génétique de Mishima en 1986.

David Lipman, directeur du centre national d'informations biotechnologiques de Bethesda, a expliqué pour sa part: "Aujourd'hui, les bases de données de séquences de nucléotides permettent aux chercheurs de partager des génomesgénomes complets, la structure génétique d'écosystèmesécosystèmes entiers, et des séquences associées à des brevets".

Auparavant, les données étaient réparties sur une bande magnétiquebande magnétique et enregistrées manuellement ou sur une disquettedisquette. Cette méthode a été remplacée par des flux de données venant de projets de séquençageséquençage du génome et de l'Office européen des brevets, ce qui garantit que toutes les séquences relevant du domaine public sont publiées le plus rapidement possible. Les chercheurs peuvent également soumettre des données directement à l'une des organisations et, grâce aux modèles harmonisés de données des trois bases de données, les séquences sont échangées automatiquement en 24 heures de manière à rendre les données disponibles via les trois bases.

À l'origine, les séquences étaient enregistrées manuellement à partir de revues scientifiques, mais ce processus a également évolué au fil des ans de telle sorte que la soumission directe de séquences de nucléotides aux bases de données fait désormais partie du processus de publication. Ce principe a également été étendu à d'autres domaines, y compris la protéomique et les modèles de processus biologiques.

"L'INSDC a établi les principes de l'échange de nombreux types d'informations biologiques", a déclaré Takashi Gojobori, directeur du centre d'informations biologiques et de la Banque de données japonaise sur l'ADN. "Étant donné que nous entrons dans l'ère des systèmes biologiques et que les chercheurs commencent à échanger des types complexes d'information, tels que les résultats d'expériences consistant à mesurer les activités de milliers de gènesgènes ou des modèles informatiques de processus entiers, il est important de se féliciter de la réalisation de ces trois bases de données qui ouvrent la voie à l'échange ouvert d'informations biologiques".

par CORDIS Nouvelles

le 31 août 2005

Nos articles

à lire aussi

Le projet DataGrid, soutenu par l'Union, a pour objectif de développer une grille d'ordinateurs délocalisés, afin que les scientifiques disposent d'une ressource de calcul et de gestion de données sans précédent. Le projet est mené par le CERN avec 20 aut

Tech

Cap sur l'e-biologie : le calcul distribué au coeur de la science

actualité

• 21/04/2005

Sciences

Recherche

Le projet médical le plus complet depuis le génome humain ?

actualité

• 07/03/2005

21 037 gènes humains en accès libre sur le web

Santé

Vie

21 037 gènes humains en accès libre sur le web

actualité

• 22/04/2004

Sciences

Recherche

Première carte complète du génome du riz

actualité

• 21/08/2005

Chimie, énergie, environnement : la recherche appliquée et la R&D sont au cœur de la croissance de demain. Des domaines de spécialisation qui offrent de bons débouchés. © Fotolia

Sciences

Actualité de l'emploi

Bac +5 : sciences, les secteurs d'emplois de demain

question réponse

• 30/01/2020

La Banque de France voit le jour en janvier 1800. © illustrez-vous, fotolia

Sciences

Histoire

Quand a été créée la première banque en France ?

question réponse

• 21/05/2018

Il existe plus de 100 formations possibles en finance à partir de Bac +2. © Fotolia

Sciences

Actualité de l'emploi

Bac + 5 : le secteur de la banque et de la finance

question réponse

• 29/01/2012

Les banques en ligne respectent les mêmes règles que les banques traditionnelles. Ouvrir un compte en ligne ne présente donc pas de risque particulier. © JESHOOTS, Pixabay, CC0 Public Domain

Maison

Finances

Banques en ligne, banques traditionnelles : quelles différences ?

question réponse

• 10/04/2017

Sciences

Philosophie

Sciences, sectes et religion

dossier

• 30/01/2003

Réflexions sur les restrictions budgétaires dans la recherche

Sciences

Philosophie

Réflexions sur les restrictions budgétaires dans la recherche

dossier

• 11/01/2004

Sciences

Philosophie

Pas de recherche... sans chercheurs !

dossier

• 29/01/2004

Système solaire. © The International Astronomical Union/Martin Kornmesser - CC BY-SA 3.0

Sciences

Astronomie

Univers et Système solaire, les bases de l'astronomie

dossier

• 01/12/2015

Le peuplier américain Populus trichocarpa

Sciences

Recherche

Premier séquençage du génome d'un arbre : le peuplier

actualité

• 19/10/2006

La Personal Genome Machine (PGM™) de la société Ion Torrent est déjà un puissant séquenceur employé pour déterminer quelles mutations sont présentes chez des patients atteints de cancers. © Ion Torrent Systems, Inc., Guilford, CT, San Francisco, CA & Beverly, MA. All rights reserved

Tech

Technologie

Séquençage du génome : dans un an il vous coûtera 1.000 $

actualité

• 08/11/2011

Le Genome analysis toolkit (GATK), un ensemble de logiciels pour le séquençage du génome, a été développé au Broad Institute. © Suravid, shutterstock.com

Tech

Technologie

En bref : Google s'engage dans la recherche médicale sur le génome

actualité

• 26/06/2015

La sélection de la

Rédaction

Le stockage chimique de l'hydrogène dans un cristal vue par l'IA. © IA BING Designer Microsoft Corporation

Sciences

Physique

Un matériau bat le record de stockage pour les moteurs à hydrogène d'un facteur 4 !

Article

Sciences

Futura-Sciences

Dernier jour pour profiter de l'abonnement Futura à partir de 2.50€ / mois seulement !

Article

Sciences

Homme

Un dentiste découvre une mandibule humaine fossile dans le carrelage d’une maison !

Article

Les artistes et les athlètes seraient plus à même d'atteindre le « flux ». © StockPhotoPro, Adobe Stock

Sciences

Skillz

Vous voulez être plus efficace au travail ? Prenez exemple sur les musiciens de jazz

Article

Illustration générée à l'aide de l'IA. © Hero Design, Adobe Stock

Sciences

Catastrophe nucléaire

Fallout : lever le pouce à bout de bras peut-il vraiment vous sauver d'une explosion nucléaire ?

Article

Image composite réunissant deux heures d’exposition de la pluie annuelle d’étoiles filantes, les Perséides, le 12 août 2016 (nuit du maximum d’activité), au-dessus du lac Svityaz, en Ukraine. © Ihor Khomych, via Spaceweather

Sciences

Astronomie

16 photos exceptionnelles d'étoiles filantes

Article

Sciences

Jupiter

Avancée spectaculaire dans l'étude du vent sur Jupiter

Article

Dans ce premier dossier, explorez en trois épisodes l'art de crypter des messages et les nouvelles applications de cet art dans le monde de l'espionnage. © C.A et DALL-E pour Futura

Sciences

Mathématiques

Les dossiers noirs : sans la cryptographie, le destin des États-Unis aurait pu être très différent...

Article

À voir aussi

definition bases azotees

actualite sur banques

milliards autres

sequencage

def genome

sequencage genome humain

acides bases

bases des mathematiques

physique bases

complementarite des bases

Mots Clés

Banque de donnée

Gêne

Bases