Des chercheurs ont mis au point une nouvelle technique de modélisation 3D baptisée HybridFlow. Celle-ci peut créer un double numérique de paysage ou de ville à partir d’images aériennes en un temps record, et sans entraînement.


au sommaire


    Pour créer un double numérique de paysage ou de ville en trois dimensions, il est nécessaire de combiner de multiples images prises depuis les cieux. Habituellement, ces photos contiennent plus de 200 mégapixels et sont prises depuis des avions à une hauteur de plus de neuf kilomètres. C'est un travail titanesque de recréer des structures en trois dimensions à partir d'une série de clichés en deux dimensions.

    De plus en plus, les spécialistes dans ce domaine se tournent vers l'apprentissage profondapprentissage profond (deep learning) et les réseaux neuronaux. Une solution qui produit d'excellents résultats, mais nécessite un long temps d'apprentissage et beaucoup de puissance de calcul. Des chercheurs de l'université Concordia, au Québec, ont mis au point un nouveau système de modélisation 3D baptisé HybridFlow qui parvient à des résultats similaires très rapidement.

    (a) Cadre d'image d'entrée. (b) Grappes à grande échelle à partir des descripteurs de caractéristiques des pixels. (c) Correspondances graphiques codées par couleur d'un groupe à échelle grossière ; première image (a). (d) Le graphique à code couleur correspond à (c) ; deuxième cadre : (e) Vecteurs de mouvement issus de la correspondance graphique des superpixels à l'échelle la plus fine. (f) Vecteurs de mouvement à partir de la correspondance des caractéristiques des pixels dans de petits groupes. (g) Flux interpolé à partir des vecteurs de mouvement initiaux combinés (e+f). (h) Flux optique final après raffinement variationnel. Erreur moyenne au point final (EPE) = 0,157. Les pixels dans (c et d) sont agrandis par 10×10 pour plus de clarté dans la visualisation. © <em>Scientific Reports</em>
    (a) Cadre d'image d'entrée. (b) Grappes à grande échelle à partir des descripteurs de caractéristiques des pixels. (c) Correspondances graphiques codées par couleur d'un groupe à échelle grossière ; première image (a). (d) Le graphique à code couleur correspond à (c) ; deuxième cadre : (e) Vecteurs de mouvement issus de la correspondance graphique des superpixels à l'échelle la plus fine. (f) Vecteurs de mouvement à partir de la correspondance des caractéristiques des pixels dans de petits groupes. (g) Flux interpolé à partir des vecteurs de mouvement initiaux combinés (e+f). (h) Flux optique final après raffinement variationnel. Erreur moyenne au point final (EPE) = 0,157. Les pixels dans (c et d) sont agrandis par 10×10 pour plus de clarté dans la visualisation. © Scientific Reports

    Une technique hybride rapide et robuste

    Dans leur article publié dans la revue Scientific Reports, les chercheurs indiquent utiliser un modèle hybridehybride pour analyser le flux optique, autrement dit le mouvementmouvement dû au déplacement de la caméra par rapport à la scène. Ils travaillent à la fois à grande échelle, pour faire correspondre certains éléments clés du paysage entre les différentes images, mais également au niveau du pixel. C'est cette approche hybride qui permet d'accélérer le traitement tout en réduisant les erreurs dues aux grands mouvements.

    HybridFlow est capable de générer une modélisation 3D de taille moyenne d'un centre urbain en moins de 30 minutes, tout en offrant des résultats similaires ou meilleurs par rapport aux autres techniques. Les modèles ainsi générés peuvent être utilisés pour le tourisme virtuel, les jeux, les films, etc. Toutefois, ils peuvent aussi servir à créer des simulations pour aider la recherche scientifique. Les chercheurs travaillent actuellement avec la ville de Terrebonne afin de simuler des inondationsinondations et déterminer les meilleurs emplacements pour des barrières, par exemple des sacs de sablesable, afin de limiter les dégâts.