Des méthodes d'analyse de données matricielles appliquées à la finance ont permis l'identification de compartiments nucléaires via des cartes de contact génétiquegénétique.

© Royyimzy Fotolia

© Royyimzy Fotolia

L'identification de compartiments nucléaires, où les interactions entre l'ADNADN avec lui-même et des protéinesprotéines de types différents, permettrait à long terme de comprendre la différentiationdifférentiation cellulaire.

Si l'on fait l'analogieanalogie entre la matrice d'adjacence d'un réseau et une carte de contact, on comprend qu'une carte de contact est une matrice d'adjacence. Il existe donc un réseau sous-jacent, dont les nœudsnœuds sont les parties de l'ADN, et dont les points représentent la présence de contact physiquephysique entre ces nœuds.

Figure 9 - Répartition des gènes des 23 chromosomes dans cinq compartiments du noyau (A, B, C, D et X<sub>inf</sub>) d'une cellule souche embryonnaire humaine. À chaque compartiment est associé une structure spécifique, donc une fonction spécifique, de l'ADN. © Julien Riposo - Tous droits réservés

Figure 9 - Répartition des gènes des 23 chromosomes dans cinq compartiments du noyau (A, B, C, D et Xinf) d'une cellule souche embryonnaire humaine. À chaque compartiment est associé une structure spécifique, donc une fonction spécifique, de l'ADN. © Julien Riposo - Tous droits réservés

En fait, certaines cartes de contact (nommées HiC) de l'ADN se comportent comme un plateau d'échec : le réseau sous-jacent est du type Checkerboard (CB) comme vu page 8. Donc, en termes de réseau, il va y avoir deux familles : les nœuds intrafamiliaux (au sein d'une même famille) interagissent fortement entre eux, mais les nœuds interfamiliaux (entre les deux familles différentes) n'interagissent presque pas. Cela suggère que le noyau se divise en deux compartiments nucléaires distincts.

L'ADN dans un noyau d'une cellule est très condensé, et forme, avec un amas de protéines, la chromatinechromatine. Ainsi, il est très connu, en biologie cellulairebiologie cellulaire, qu'il existe des régions où la chromatine est dense (elle est appelée hétérochromatine) et où elle est peu dense (elle est appelée euchromatine). Selon ce qui a été expliqué précédemment, le compartiment nucléaire euchromatine est l'ensemble des régions du noyau où l'on trouve de l'euchromatine, idem pour le compartiment nucléaire hétérochromatine. Ainsi, cela signifierait que l'euchromatine interagit plus avec de l'euchromatine qu'avec de l'hétérochromatine, et que l'hétérochromatine interagit plus avec de l'hétérochromatine qu'avec de l'euchromatine.

À vrai dire, des études ont prouvé qu'il existait, non pas deux, mais entre trois et cinq compartiments nucléaires distincts, et ceci à partir de l'analyse de données de cartes de contacts. Nous allons donc au-delà de la simple condensationcondensation de la chromatine ! Les rôles de chacun des compartiments ne sont pas encore tout à fait clairs aujourd'hui.

Mais alors, où intervient la finance ? Il faut savoir que l'analyse de données matricielles en biologie a sérieusement commencé il y a moins d'une dizaine d'années, alors qu'en finance il y a plus d'une vingtaine d'années. Étant donné, comme nous l'avons vu, la similarité des données en biologie et en finance, il s'avère que, pour analyser une matrice de biologie, il convient de s'inspirer de ce qui a déjà été traité en finance. Les méthodes abondent et l'on ne peut s'empêcher de citer, par exemple, l'Analyse en composantes principales (ACP), ou bien l'analyse multifactorielle (matrices généralisées, non pas en 2D, mais en nD !), faisant appel à des techniques mathématiques toutes aussi riches les unes que les autres.