Le Data Mining vise à analyser les flots de données qui nous arrivent de toutes parts. © Konstantin Hermann, Fotolia

Tech

Data Mining

DéfinitionClassé sous :big data , data mining , analyse de données

Le terme de Data Mining est un terme anglo-saxon qui peut être traduit par « exploration de données » ou « extraction de connaissances à partir de données ». Ainsi le Data Mining consiste en une famille d'outils -- qu'ils soient automatiques ou semi-automatiques -- permettant l'analyse d'une grande quantité de données contenues dans une base. Objectif : faire apparaître des corrélations entre des phénomènes en apparence distincts afin d'anticiper des tendances.

Le Data Mining pour qui ?

Les entreprises évoluent dans un environnement de plus en plus complexe. Avec le succès de la numérisation, l'avènement d'Internet -- le web représente un réservoir de données colossal qui continue de croître chaque jour -- et l'émergence des objets connectés, les entreprises sont entrées dans l'air du Big Data. Elles sont inondées d'informations en tous genres. Et le volume des données stockées a de quoi faire tourner les têtes. Sans parler de leur variété (textes, images, sons, etc.) qui ne cesse de s'accroître, toujours en corrélation avec les données qui circulent en ligne.

Le Data Mining, une foule d’applications. © Ramaba, Wikiversity, CC by-3.0

Les entreprises s'appuient donc, par exemple, sur les techniques de Data Mining dans le domaine du marketing. Pour maximiser le rendement de leurs opérations ou même personnaliser une offre suivant un profil d'achat, identifier les clients susceptibles d'opter pour la concurrence, étudier les usages des canaux de communication, etc. Elles exploitent également le Data Mining pour identifier les clients à risque (octroi d'un crédit ou souscription d'une assurance), anticiper la survenue d'incidents financiers, lutter contre les utilisations frauduleuses de cartes bancaires, etc.

Les pouvoirs publics s'intéressent également au Data Mining dans le cadre de la caractérisation des crimes, par exemple, ou pour des questions touchant à la défense d'un pays. Enfin la science, bien sûr, peut en tirer parti dès lors qu'il s'agit de caractériser un phénomène complexe comme un comportement humain ou l'expression d’un gène. Ainsi en génétique, le Data Mining aide à percer la relation de correspondance entre ADN et maladies en comprenant comment des changements dans une séquence ADN affectent le risque de développer une maladie.

Le Data Mining, comment ça marche ?

Pour mener à bien un projet de Data Mining, il faut évidemment d'abord définir clairement la problématique à étudier. Ensuite, il est crucial de sélectionner parmi l'ensemble des données disponibles, celles qui pourront être utilisées. C'est-à-dire celle dont la qualité ne laisse aucune place au doute, par exemple. Le tout en s'assurant que le nombre de données exploitées reste en corrélation avec la complexité du problème traité. Plus le problème est complexe, plus il faudra de données. Vient alors l'étape de paramétrage du modèle construit à partir de techniques issues des méthodes statistiques, des analyses de données et de l'informatique. L'objectif peut être d'extrapoler de nouvelles données à partir d'une base, de mettre en évidence des données existantes noyées dans la masse ou de réduire la masse des données. Enfin, il faut procéder à l'étude des résultats. Les logiciels ne sont en effet pas autosuffisants et l'intervention d'un analyste spécialisé reste indispensable.

Abonnez-vous à la lettre d'information La quotidienne : nos dernières actualités du jour.

!

Merci pour votre inscription.
Heureux de vous compter parmi nos lecteurs !

Cela vous intéressera aussi

Kézako : comment crypte-t-on les données sur Internet ?  La cryptographie est la plus ancienne forme de chiffrement. On trouve des traces de son utilisation jusqu'en 2.000 avant J.-C. Cette technique encore utilisée aujourd’hui, notamment sur le Web, dévoile ses mystères en vidéo grâce au programme Kézako d'Unisciel et de l'université Lille 1.