Sciences

Mathématiques de données : des phénomènes identiques dans les données

Dossier - Quand biologie et finance se rencontrent grâce aux mathématiques
DossierClassé sous :Mathématiques , biologie , finance

Docteur et financier quantitatif

-

Physique, chimie, biologie, informatique, économie, finance, sociologie, psychologie… Tous les domaines passent aujourd'hui par des modèles mathématiques. Ces outils rigoureux permettent de rendre compte de phénomènes contre-intuitifs, ou bien de la validation quantitative de grandeurs. Ainsi, il n'est pas étonnant de retrouver des similarités entre deux modèles, venant chacun d'un domaine distinct…

  
DossiersQuand biologie et finance se rencontrent grâce aux mathématiques
 

Le concept de « mathématiques de données»permet l'établissement de liens entre plusieurs domaines distincts, comme celui de la biologie ou de la finance. Mais les mathématiques sous-jacentes ne pourraient être « devinées » sans aperçu des données.

Les mathématiques sont comprises en tant qu'ensemble d'idées abstraites, dans le sens ou le monde réel - ou plutôt la réalité - n'a pas à intervenir. Pourtant, certains faits observables dans des données expérimentales en biologie et finance peuvent être contre-intuitifs. Dès lors, les mathématiques de données sont des mathématiques nées de l'observation de ces faits contre-intuitifs et qui visent à les formaliser. Cette formalisation a pour but de résoudre des problèmes dans un domaine (comme celui de la biologie) à l'aide d'un autre domaine (comme celui de la finance) ou le même genre de problème a été résolu.

Figure 3 - Les méthodes de finance permettent la résolution de problèmes de biologie. © CC BY-NC 2.0

Le lecteur aura donc bien saisi que la naissance du formalisme provient de l'observation de données identiques. Nous allons tenter de donner une illustration de ce que pourrait représenter le concept de mathématiques de données, en montrant la résolution de problèmes actuels de biologie en s'inspirant de ce qui a déjà été fait en finance. Bien sûr, nous pouvons généraliser à tout domaine scientifique.

Un exemple de résolution typique de problème de biologie est l'identification de compartiments dans le noyau d'une cellule. Un compartiment est une zone localisée dans le noyau, où les fonctions biologiques de l'ADN sont spécifiques. Les données correspondantes sont des matrices, tableaux bidimensionnelles de nombres. Nous verrons aussi un autre exemple dont les données sont sous forme de série temporelle : ce sont des matrices à une seule ligne.