L'algorithme qui fait avancer la biologie

Tech

Algorithme

ADN

actualité

• 4 Min

Pour comprendre les liens de parenté et l'évolution des espèces vivantes, les chercheurs peuvent comparer leurs génomes, stockés sous la forme de millions de séquences d'ADN dans des banques de données. Une tâche parfois insurmontable, jusqu'à l'arrivée du logiciel PhyML.

au sommaire

Vous êtes biologiste et vous voulez savoir quel est le degré de parenté et l'histoire évolutive entre les différentes espècesespèces de levureslevures (ou de vers, ou d'insectesinsectes, ou d'oiseaux) que vous êtes en train d'étudier. La méthode la plus fiable, celle qui ne vous induira pas en erreur par des ressemblances morphologiques superficielles, c'est la phylogénie moléculairephylogénie moléculaire : comparer le génomegénome de vos bestioles. Pour ce faire, vous disposez désormais de banques de données regroupant des millions de séquences d'ADNADN correspondant à des dizaines de milliers d'espèces vivantes. Mais, sans outils adaptés pour les comparer, elles resteront une suite muette de A, T, C et G.

C'est là qu'interviennent OlivierOlivier Gascuel et Stéphane Guindon, chercheurs au Laboratoire d'informatique, de robotique et de microélectronique de Montpellier (Lirmm). Ces chercheurs ont mis au point en 2003 un puissant algorithme. Il permet d'estimer les relations évolutives liantliant un ensemble d'organismes à partir de la comparaison de leur ADN ou bien des acides aminésacides aminés de leurs protéinesprotéines. Cette méthode a eu un succès fulgurant, tant et si bien que le papier qui la présentait dans Systematic Biology est aujourd'hui en bonne place dans le Science Citation Index.

On comprend pourquoi : cet algorithme permet de réduire drastiquement les temps de calcul par rapport aux méthodes précédentes. De plus, il peut être utilisé avec des données bien plus complexes et longues. « Il y a des recherches que l'on n'imaginait pas pouvoir faire et qui ne demandent maintenant que quelques minutes, explique Olivier Gascuel. Personne n'osait aborder des problèmes qui mettaient en jeu 100, 200 ou 500 espèces et des séquences longues de plusieurs milliers, voire dizaines de milliers de lettres. Après des jours et des jours de calcul on devait tout arrêter sans avoir obtenu de résultat. Notre logiciel permet de traiter ces données. »

Sur la base de cet algorithme, les chercheurs ont développé un logiciel baptisé PhyML. Il est en accès libre sur Internet, comme c'est l'usage dans le domaine. Les chercheurs du monde entier profitent de sa simplicité d'utilisation : ils n'ont plus qu'à entrer leurs données et à attendre que les huit processeurs de l'ordinateur du Lirmm s'en occupent. Ils reçoivent les résultats par e-mail quelques heures ou minutes plus tard. « Le serveur tourne à plein régime : il y a trois ou quatre utilisateurs en permanence. À chaque fois que je vais dans un congrès, j'entends des gens parler de notre programme ! »

Le principe de base de l'algorithme est celui du maximum de vraisemblance, concept majeur en statistique. Il consiste ici à définir un modèle hypothétique qui décrive à la fois le degré de parenté entre les espèces étudiées et les mutations qui ont pu se produire à partir de la séquence originale postulée. Ensuite, il calcule la probabilité que les données correspondent à l'hypothèse de départ. Le processus est réitéré, modèle après modèle, jusqu'à ce que cette probabilité soit maximale. Le modèle correspondant constitue la réponse de l'algorithme. Ce tâtonnement demandait des temps de calculs colossaux jusqu'à l'arrivée de PhyML, qui est en fait une approximation plus que satisfaisante de ce principe. C'est ainsi qu'on voit les espèces former un arbrearbre où chaque noeudnoeud correspond à un ancêtre communancêtre commun et où la longueur des branches représente le temps pendant lequel les espèces ont évolué.

<br />Grâce à PhyML, on a pu reconstruire l'arbre phylogénétique des primates à partir de séquences d'ADN représentant plus de 900 000 paires de bases. Chaque nœud correspond à un ancêtre commun, et la longueur des branches, au temps d'évolution.<br />© F. Chevenet /IRD.

Grâce à PhyML, on a pu reconstruire l'arbre phylogénétique des primates à partir de séquences d'ADN représentant plus de 900 000 paires de bases. Chaque nœud correspond à un ancêtre commun, et la longueur des branches, au temps d'évolution.
© F. Chevenet /IRD.

« Autrefois, on faisait des phylogénies sur un seul gène, alors que dans les banques d'ADN on en dispose de milliers. Aujourd'hui, chaque espèce est représentée par 50 ou 100 gènes, et donc, les phylogénies sont beaucoup plus fiables », explique Olivier Gascuel. Une aubaine pour les biologistes, car la phylogénétique prend de plus en plus d'importance. « Environ un papier sur quatre en biologie contient une analyse phylogénétique, rappelle le chercheur. On utilise ces méthodes depuis l'étude fonctionnelle des gènes jusqu'aux recherches sur la biodiversité en passant, par exemple, par l'étude des virus comme le VIH ou le Sras. »

La phylogénétique a provoqué de véritables petites révolutions chez les biologistes systématiciens. Ainsi, on s'est aperçu que dans le monde végétal, les caractères morphologiques comme la forme des feuilles ou la couleurcouleur des fleurs étaient de très mauvais indicateurs pour regrouper les plantes en ordres, familles et genres. En revanche, évaluer leur degré de parenté au niveau du génome est maintenant une méthode très sûre.

Avec PhyML, au grand projet classificatoire initié par Linné, le célèbre naturaliste suédois, s'associent les techniques les plus récentes de l'inférence statistique. Mais un autre intérêt se dégage : la possibilité de comprendre les processus évolutifs au niveau des génomes. Un vaste programme de recherches auquel participent nos deux chercheurs : Olivier Gascuel s'intéresse aux séquences répétées de l'ADN tandis que Stéphane Guindon (entré cette année au CNRS) travaille sur les mécanismes de sélection des mutations chez les virus.

Dans leurs travaux, ils se servent, bien entendu, de leur propre algorithme. Mais aussi des nouvelles versions du programme qu'ils sont en train de développer. Car PhyML n'est pas un fossile vivantfossile vivant destiné à se maintenir tel quel. Les chercheurs travaillent sur des prototypes, des variants qui devraient permettre une sélection plus fiable du bon modèle. Le logiciel évolue... et c'est bien naturel !

Sebastián Escalón

Contact

Olivier Gascuel
Lirmm, Montpellier
[email protected]

par Journal du CNRS

le 3 décembre 2005

Nos articles

à lire aussi

Premier calcul de l'ordinateur Quantique...

Tech

Informatique

Premier calcul de l'ordinateur Quantique...

actualité

• 13/01/2002

La logique floue améliore les boites de vitesses automatiques

Sciences

Recherche

La logique floue améliore les boites de vitesses automatiques

actualité

• 06/06/2003

Tech

Un logiciel crée automatiquement de bons résumés de texte

actualité

• 18/04/2005

Bio-inspirations fractales. © YMF, domaine public

Sciences

Mathématiques

Bio-inspirations, fractales, complexité et émergence

dossier

• 21/04/2022

L'ordinateur quantique. © Domaine public

Sciences

Physique

L'ordinateur quantique

dossier

• 19/09/2005

Développé pour le compte d’États désireux de pratiquer la surveillance électronique et/ou l’espionnage industriel, le malware Pegasus peut être utilisé par des pirates. © Brian A Jackson, Shutterstock

Tech

Sécurité

Une faille dans les iPhone a permis d'espionner des journalistes

actualité

• 21/12/2020

Tech

Sécurité

Spyware : se protéger avec le logiciel Spybot

question réponse

• 02/11/2010

Le mode Chasseur de Revo Uninstaller permet de désinstaller l’application liée à une icône. Il suffit de cliquer sur l’icône dans ce mode pour activer la désinstallation ou la suppression du démarrage du logiciel. © Guénaël Pépin

Tech

Système

Windows : désinstaller proprement un logiciel avec Revo Uninstaller

question réponse

• 21/06/2012

Tech

Technologie

Nanotechnologies : l'essor des nanobiologie, info, et nanotechnologies

dossier

• 18/03/2007

Tech

Technologie

Cinq techniques high-tech pour conserver les aliments

question réponse

• 01/04/2024

Tech

Informatique

Netflix : comment fonctionne l'algorithme de recommandations ?

question réponse

• 28/03/2018

Vers la privatisation totalitaire de l'immatériel

Tech

Informatique

Vers la privatisation totalitaire de l'immatériel

dossier

• 08/05/2003

Tech

Technologie

Un logiciel pour décrypter votre humeur !

actualité

• 10/07/2007

Pour éviter la cacophonie entre réseaux Wi-Fi voisins, il suffit que chaque émetteur-récepteur adapte intelligemment les bandes de fréquence qu'il utilise. © Alain Herzog

Tech

Internet

Un algorithme aide les réseaux Wi-Fi à mieux cohabiter

actualité

• 28/01/2015

Tech

Orion : Google embauche l'auteur d'un algorithme "révolutionnaire"

actualité

• 11/04/2006

La sélection de la

Rédaction

Plusieurs sites se sont développés pour soutenir les agriculteurs et une alimentation plus saine. © Image de Freepik

Tech

Jeunes Pousses

11 sites pour manger plus sainement et soutenir les producteurs locaux

Article

Une photo d'une jeune femme souriante a été altérée par un dessinateur pour donner l'impression qu'elle tient une arme (crayonnée sur la photo). © Dall.E

Tech

Netflix utilise en secret des images générées par IA dans ses documentaires

Article

La précarité menstruelle concerne entre 1,5 et 2 millions de femmes. © Nenetus, Adobe Stock

Tech

Jeunes Pousses

Lutte contre la précarité menstruelle : Marguerite & Cie en première ligne

Article

Avec son réseau de voisins-relais, Pickme permet de réduire les 20 % d’échecs à la première livraison. © Pickme

Tech

Jeunes Pousses

Les voisins-relais, la bonne idée pour réduire les échecs de livraison

Article

40 % des aides ne sont pas réclamées en France ! Klaro a créé une application destinée à faciliter l’accès aux aides. © peopleimages.com, Adobe Stock

Tech

Jeunes Pousses

Ne passez plus à côté des aides auxquelles vous avez droit grâce à cette appli

Article

L’intelligence organoïde, promesse ou utopie ?

Tech

Intelligence artificielle

L’intelligence organoïde, promesse ou utopie ?

Article

Tech

Voiture

Renault Group accélère sur les pièces reconditionnées pour les voitures électriques

Article

100 millions de lunettes dorment au fond des tiroirs des Français. © Vecstock, Freepik

Tech

Jeunes Pousses

Cette startup française change la vision du monde avec des lunettes recyclées à petits prix !

Article

À voir aussi

high tech tv

high-tech

phylogenie moleculaire

algorithme symetrique

phylogenie des mammiferes

logiciel algorithme

habitat high tech paris

algorithme gps

algorithme pid

algorithme exercice

Mots Clés

PhyML

Phylogénie moléculaire

Logiciel

Prototypes

Séquence

Gêne

Espèce