Sciences

Analyse de données : avant-goût de décomposition matricielle

Dossier - Quand biologie et finance se rencontrent grâce aux mathématiques
DossierClassé sous :Mathématiques , biologie , finance

Docteur et financier quantitatif

-

Physique, chimie, biologie, informatique, économie, finance, sociologie, psychologie… Tous les domaines passent aujourd'hui par des modèles mathématiques. Ces outils rigoureux permettent de rendre compte de phénomènes contre-intuitifs, ou bien de la validation quantitative de grandeurs. Ainsi, il n'est pas étonnant de retrouver des similarités entre deux modèles, venant chacun d'un domaine distinct…

  
DossiersQuand biologie et finance se rencontrent grâce aux mathématiques
 

Une matrice se divise en plusieurs composantes. Chacune des composantes décrit une caractéristique précise de la matrice, et donc un fait biologique ou financier. Nous voyons ici un exemple de matrice en biologie et un exemple en finance.

Une technique très utilisée aujourd'hui est la décomposition matricielle. Il existe plusieurs types de décomposition, et nous verrons la décomposition en valeurs propres.

Figure 5 - Une matrice peut se décomposer, et les composantes résultantes sont susceptibles de montrer des comportements invisibles dans la matrice initiale. © Julien Riposo - Tous droits réservés

Posons n l'entier naturel non nul qui est le nombre de lignes (et donc de colonnes) de la matrice, que nous noterons M. On appelle n la taille de la matrice M. En pratique, n vaut de l'ordre de 100 en finance et de l'ordre du million au milliard en biologie. Une quantité qui intéresse la communauté scientifique est le « vecteur degrés », noté Me, de la matrice M (un vecteur est une matrice à une seule ligne, les colonnes étant appelées « composantes » du vecteur). En remarquant que l'on peut associer chaque ligne de la matrice M a un vecteur, le vecteur degrés Me s'obtient en sommant toutes les je composantes entre elles de chacune des lignes de la matrice M, et ceci pour toutes les colonnes j (j = 1, j = 2,..., j = n).

Pour analyser ces données, on commence par décomposer la matrice M en ses sous-espaces propres, ayant chacun une signification biologique ou financière (connue ou non !) selon le contexte. Cette décomposition a pour rôle de simplifier l'étude et voir à travers chacune de ces composantes des propriétés invisibles directement sur la matrice M, qui est en pratique trop complexe. Il y a n sous-espaces propres, autant que la taille de la matrice. Au sous-espace propre numéro i correspond une valeur propre λi, et une matrice Mi dont on va pouvoir extraire le vecteur propre Vi qu'on dit associé « à la valeur propre λi ». Le spectre de la matrice M est l'ensemble des valeurs propres de cette matrice. Ainsi, la décomposition (unique) donne donc :

M = λ1M12M2+...λnMn     (1)

Par convention λ1 est la valeur propre la plus élevée, λ2 la seconde valeur propre la plus élevée, et ainsi de suite. Par abus de langage, on nommera V1 premier vecteur propre.