Sciences

Les compartiments nucléaires : comment les voir dans les données ?

Dossier - Quand biologie et finance se rencontrent grâce aux mathématiques
DossierClassé sous :Mathématiques , biologie , finance

Docteur et financier quantitatif

-

Physique, chimie, biologie, informatique, économie, finance, sociologie, psychologie… Tous les domaines passent aujourd'hui par des modèles mathématiques. Ces outils rigoureux permettent de rendre compte de phénomènes contre-intuitifs, ou bien de la validation quantitative de grandeurs. Ainsi, il n'est pas étonnant de retrouver des similarités entre deux modèles, venant chacun d'un domaine distinct…

  
DossiersQuand biologie et finance se rencontrent grâce aux mathématiques
 

Des méthodes d'analyse de données matricielles appliquées à la finance ont permis l'identification de compartiments nucléaires via des cartes de contact génétique.

L'identification de compartiments nucléaires, où les interactions entre l'ADN avec lui-même et des protéines de types différents, permettrait à long terme de comprendre la différentiation cellulaire.

Si l'on fait l'analogie entre la matrice d'adjacence d'un réseau et une carte de contact, on comprend qu'une carte de contact est une matrice d'adjacence. Il existe donc un réseau sous-jacent, dont les nœuds sont les parties de l'ADN, et dont les points représentent la présence de contact physique entre ces nœuds.

Figure 9 - Répartition des gènes des 23 chromosomes dans cinq compartiments du noyau (A, B, C, D et Xinf) d'une cellule souche embryonnaire humaine. À chaque compartiment est associé une structure spécifique, donc une fonction spécifique, de l'ADN. © Julien Riposo - Tous droits réservés

En fait, certaines cartes de contact (nommées HiC) de l'ADN se comportent comme un plateau d'échec : le réseau sous-jacent est du type Checkerboard (CB) comme vu page 8. Donc, en termes de réseau, il va y avoir deux familles : les nœuds intrafamiliaux (au sein d'une même famille) interagissent fortement entre eux, mais les nœuds interfamiliaux (entre les deux familles différentes) n'interagissent presque pas. Cela suggère que le noyau se divise en deux compartiments nucléaires distincts.

L'ADN dans un noyau d'une cellule est très condensé, et forme, avec un amas de protéines, la chromatine. Ainsi, il est très connu, en biologie cellulaire, qu'il existe des régions où la chromatine est dense (elle est appelée hétérochromatine) et où elle est peu dense (elle est appelée euchromatine). Selon ce qui a été expliqué précédemment, le compartiment nucléaire euchromatine est l'ensemble des régions du noyau où l'on trouve de l'euchromatine, idem pour le compartiment nucléaire hétérochromatine. Ainsi, cela signifierait que l'euchromatine interagit plus avec de l'euchromatine qu'avec de l'hétérochromatine, et que l'hétérochromatine interagit plus avec de l'hétérochromatine qu'avec de l'euchromatine.

À vrai dire, des études ont prouvé qu'il existait, non pas deux, mais entre trois et cinq compartiments nucléaires distincts, et ceci à partir de l'analyse de données de cartes de contacts. Nous allons donc au-delà de la simple condensation de la chromatine ! Les rôles de chacun des compartiments ne sont pas encore tout à fait clairs aujourd'hui.

Mais alors, où intervient la finance ? Il faut savoir que l'analyse de données matricielles en biologie a sérieusement commencé il y a moins d'une dizaine d'années, alors qu'en finance il y a plus d'une vingtaine d'années. Étant donné, comme nous l'avons vu, la similarité des données en biologie et en finance, il s'avère que, pour analyser une matrice de biologie, il convient de s'inspirer de ce qui a déjà été traité en finance. Les méthodes abondent et l'on ne peut s'empêcher de citer, par exemple, l'Analyse en composantes principales (ACP), ou bien l'analyse multifactorielle (matrices généralisées, non pas en 2D, mais en nD !), faisant appel à des techniques mathématiques toutes aussi riches les unes que les autres.