Le Data Scientist est le socle de la réussite d’un projet Big Data. Il possède un profil hybride entre statisticien, mathématicien et informaticien. Et il doit aimer travailler avec le business. Il ne court pas les rues. Des formations spécifiques apparaissent.
Big Data, Big Jobs. Les emplois qui vont être créés dans le Big Data se précisent au fil des interventions des experts qui se multiplient ces derniers jours. Il y aura des statisticiens, des mathématiciens, des développeurs informatiques, des analystes, des visualisateurs de données, des spécialistes des infrastructures informatiques et des spécialistes de la Business Intelligence. C’est ce qui ressort de trois événements « Big Data » organisés les 14 et 19 novembre derniers.
De plus, ces professionnels devront absolument savoir communiquer car on ne fait pas du Big Data tout seul. Ils devront dialoguer d’un côté avec les responsables des métiers et fonctionnels, dont le marketing en première ligne, qui vont s’intéresser au « quoi ? » et de l’autre avec les responsables de la DSI (Direction des systèmes d’information) qui vont s’intéresser au « comment ? ».
Un statisticien qui sait communiquer
Le Data Scientist figure au premier rang des professionnels du Big Data. Le terme garde encore une part de mystère. Certains le considèrent comme un statisticien créant des algorithmes et d’autres plutôt comme un mathématicien développeur informatique. Il a la charge de réaliser des modèles et des algorithmes permettant d’analyser la réalité et de la prédire d’un point de vue business. Et il doit se rendre compréhensible des responsables métiers.
Vincenzo Esposito Vinzi, statisticien et enseignant chercheur à l’école de commerce Essec, est catégorique : « le Data Scientist est un statisticien. » Il s’exprimait le 19 novembre, lors de l’événement Big Data organisé par l’Adetem (Association nationale du marketing), à Paris. « Il s’agit de gens capables d’interpréter et de communiquer autour des résultats, des analyses. Ils sont capables de parler à plusieurs fonctions dans l’entreprise » décrit-il.
Il insiste : « ce n’est pas le statisticien triste incapable de communiquer. » Le professeur exclut les statisticiens « qui analysent les données pour eux-mêmes, en se faisant plaisir sur des modèles plutôt que pour aider à prendre des décisions. » Vu l’importance des besoins actuels, il annonce que l’Essec va former des Data Scientists.
Le Data Scientist est un mathématicien
Chez Criteo, le champion français du retargeting publicitaire, le Data Scientist est plutôt vu comme « un profil entre mathématicien et développeur informatique. » C’est ainsi que le décrit le co-fondateur et CTO (Chief Technology Officer) de Criteo, Romain Niccoli, lui-même issu de l’école des Mines. Le métier de Criteo est d’afficher les bannières publicitaires les plus susceptibles d’intéresser un internaute au vu de son historique de parcours sur le web.
Une équipe de Data Scientists chez Criteo …
Le Big Data doit être statistique et non mathématique pour Vincenzo Esposito Vinzi
Vincenzo Esposito Vinzi est statisticien et enseignant chercheur à l’Essec. Il a pris la parole le 19 novembre lors de l’événement Big Data organisé par l’Adetem. Pour lui, le Big Data est une évolution nécessaire et ce n’est pas un sujet spécifique à un domaine que ce soit les systèmes d’information, les technologies, le marketing ou les statisticiens. « C’est un sujet qui va obliger des mondes différents à se parler. Ce qui n’est pas évident » admet-il. De même, il devra y avoir un dialogue entre les entreprises et le monde académique. Il souhaite que l’on parle de modèles souples qui s’adaptent. « Lors de la crise financière, on avait beaucoup de données. Il y avait trop de choses mathématiques, des algorithmes mathématiques et pas assez statistiques » critique-t-il. Il veut que l’on puisse inclure de l’incertitude. « il y a donc du travail à faire en modèles statistiques. Des algortihmes sont en train d’être développés. Il est risqué pour les entreprises d’attendre et de ne rien faire, même si tout n’est pas prêt ou de s’en tenir à des analyses trop classiques. »
Photo d’ouverture, de gauche à droite, le 19 novembre : Vincenzo Esposito Vinzi, statisticien et professeur chercheur à l’Essec, Caroline Faillet du cabinet Bolero, et Romain Niccoli, co-fondateur et CTO de Criteo.