Data Scientist : le mouton à cinq pattes du Big Data

Data & Co

Comme souvent dans la jeune histoire de l’informatique, l’émergence de nouvelles technologies rend obsolète d’anciens métiers et complètement indispensables de nouveaux métiers aux contours encore flous.

Le big data n’échappe pas à cette loi d’airain et s’il est considéré comme l’eldorado des entités innovantes, le manque de compétences est un frein manifeste au développement et aux croissances exponentielles promises.

Cependant, des formations émergent (grandes écoles, cursus certifiants, formations techniques…) qui laissent espérer un retournement de situation rapide. Pour les moutons à cinq pattes, des perspectives de recrutement, des salaires élevés et les privilèges des précurseurs….

Un marché particulièrement tendu pour les recruteurs

En permanence en quête de nouveaux leviers de croissance, les entreprises recherchent l’oiseau rare et sont prêtes à certains sacrifices financiers, on parle par exemple de salaires de 100 000 $ annuels aux Etats-Unis.

Loin de ne concerner que quelques Happy Few, le volume de postes à pourvoir est également édifiant avec une estimation d’environ 2000 Data Scientists à recruter dans les 3 ans selon le Syntec.

Peu de candidats sur le marché, une demande forte, des salaires qui s’envolent, l’équation devient très difficile à résoudre pour les recruteurs.

Pourquoi l’émergence du big data aujourd’hui ?

90% des données qui circulent sur internet aujourd’hui n’existaient pas il y a deux ans ! Les géants de la silicon valley ont promu la donnée informatique au rang de carburant de leur croissance exponentielle. Les réseaux sociaux en particulier charrient des quantités de données sans précédent et non structurées (vidéos, liens, photos, textes, sons…).

Par ailleurs, ce qui caractérise le Big Data s’exprime par la règle des 3 V pour Volume, Vitesse et Vélocité. En ce sens les technologies d’analyse des données d’entreprises (décisionnel, Business Intelligence, référentiels, Data Mining…) s’appuyaient toutes sur des sources de données structurées et des volumes n’ayant rien à voir.

Le nouveau paradigme de l’analyse de données Big Data s’appuie donc sur la capacité à traiter rapidement des volumes multisources faramineux afin d’apporter des services pertinents et innovants à ses clients à partir de l’analyse du marché et des comportements des consommateurs.

Malgré tout, encore aujourd’hui, mis à part les spécialistes et les géants du web, la plupart des initiatives lancées par de grandes entreprises sur ces sujets restent des expérimentations à plus ou moins grande échelle.

Le rôle du Data Scientist

De culture plutôt scientifique (la maitrise des statistiques et des probabilités est un prérequis), il aura besoin d’avoir un socle informatique avec la maîtrise d’au moins un langage de développement objet (Java, C++ ou C#).

Le Data Scientist doit d’abord sélectionner les sources de données pertinentes (flux de données d’objets connectés, réseaux sociaux, Canaux de vente, sites fédérateurs…) et mettre en œuvre l’alimentation de son système d’information Big Data comme Hadoop en particulier avec l’aide de techniciens.

Il va ensuite traiter les données à travers des outils de Data Visualization comme par exemple QlikView ou Tableau Software.

Ce traitement à partir de données concentrées (tableaux, graphiques, Dashboards) permettra de prendre des décisions pour des lancements de nouveaux services et produits de manière étayée.

À travers son parcours professionnel, le Data Scientist désireux d’évoluer pourra développer ses compétences managériales et prétendre alors au poste de Chief Data Officer.

La formation : la clé permettant de résoudre la pénurie

Il est évident que le moyen le plus simple de résoudre la pénurie actuelle et surtout future de spécialistes consistera à former des étudiants et de reconvertir des profils de professionnels « proches » en termes de compétences actuelles.

Pour les premiers, déjà 6 filières de formation Big Data sont proposées par de grandes écoles et universités en France : l’ENSAE et Télécom ParisTech, HEC, Polytechnique, l’UPMC (Université Pierre et Marie Curie), l’EMSI et l’ENSIMAG à Grenoble.

Inutile de préciser que les étudiants n’auront pas de problème d’embauche et qu’ils n’auront qu’à choisir le projet le plus prometteur.

Découvrez nos formations en Data Science  et en Big Data pour vous mettre au niveau !

Le Pont Learning