Loading...
Data

La data science, qu’est-ce que c’est ?

data_science_intelligence_artificielle

La data science, dont le nom est apparu en 2002, est une science interdisciplinaire qui implique des algorithmes, des processus, des méthodes scientifiques, etc. et vise l’exploitation de données. Des connaissances en informatique, en statistiques et même en commerce sont nécessaires pour faire de la data science. L’idée est d’analyser des ensembles de données qui ont été collectées auprès de clients par exemple, grâce à des capteurs, des habitudes de navigation web, des smartphones… Plus précisément, à quoi la data science sert-elle et que fait le data scientist ?

 

L’objectif de la data science

 

Le principal objectif de la data science dans une entreprise est d’améliorer les services et les produits que celle-ci propose. En effet, en récoltant et en analysant les données de sa clientèle, une entreprise peut adapter son offre aux préférences et aux habitudes des consommateurs, mais aussi aux tendances du marché. En médecine, la data science peut permettre aux médecins de faire leurs diagnostics au plus tôt et de traiter ainsi efficacement leurs patients, à partir de l’analyse des données collectées dans les tests médicaux. En logistique, la data science permet par exemple d’analyser les conditions météorologiques ou encore les tendances du trafic et ainsi d’optimiser la vitesse de livraison et de diminuer les coûts.

 

Le métier de data scientist

 

Le data scientist commence par réfléchir à des stratégies d’analyse de données, prépare les données pour leur analyse, puis traite les informations qui en ressortent. Il crée ensuite des modèles à partir de ces données, en tenant compte des langages de programmation pour qu’ils soient déployés dans des applications. Le data scientist travaille généralement avec d’autres personnes, puisque la data science nécessite également des compétences en commerce ou en informatique. Le processus est plus itératif que linéaire : il repose sur des phases qui sont répétées à plusieurs reprises. C’est la modélisation prédictive.

Les plus récents