Le concept de « mathématiques de données » permet l'établissement de liens entre plusieurs domaines distincts, comme celui de la biologie ou de la finance. Mais les mathématiques sous-jacentes ne pourraient être « devinées » sans aperçu des données.

© Monsitj Fotolia

© Monsitj Fotolia

Les mathématiques sont comprises en tant qu'ensemble d'idées abstraites, dans le sens ou le monde réel - ou plutôt la réalité - n'a pas à intervenir. Pourtant, certains faits observables dans des données expérimentales en biologie et finance peuvent être contre-intuitifs. Dès lors, les mathématiques de données sont des mathématiques nées de l'observation de ces faits contre-intuitifs et qui visent à les formaliser. Cette formalisation a pour but de résoudre des problèmes dans un domaine (comme celui de la biologie) à l'aide d'un autre domaine (comme celui de la finance) ou le même genre de problème a été résolu.

Figure 3 - Les méthodes de finance permettent la résolution de problèmes de biologie. © CC BY-NC 2.0

Figure 3 - Les méthodes de finance permettent la résolution de problèmes de biologie. © CC BY-NC 2.0

Le lecteur aura donc bien saisi que la naissance du formalisme provient de l'observation de données identiques. Nous allons tenter de donner une illustration de ce que pourrait représenter le concept de mathématiques de données, en montrant la résolutionrésolution de problèmes actuels de biologie en s'inspirant de ce qui a déjà été fait en finance. Bien sûr, nous pouvons généraliser à tout domaine scientifique.

Un exemple de résolution typique de problème de biologie est l'identification de compartiments dans le noyau d'une cellule. Un compartiment est une zone localisée dans le noyau, où les fonctions biologiques de l'ADNADN sont spécifiques. Les données correspondantes sont des matrices, tableaux bidimensionnelles de nombres. Nous verrons aussi un autre exemple dont les données sont sous forme de série temporelle : ce sont des matrices à une seule ligne.