Une équipe de Data Scientists chez Criteo
La technologie de Criteo s’appuie massivement sur le Big Data et la société a constitué sa propre équipe de Data Scientists regroupés dans une entité baptisée « Engine ». « Ils déterminent les algorithmes pour ‘cruncher’ la donnée » décrit Romain Niccoli. Cruncher? C’est le fait de réduire le volume d’informations nécessaire en entrée des serveurs. « Il s’agit de ne pas travailler avec des statistiques naïves » pointe-t-il.
Si l’on appliquait un algorithme de statistiques pur, il faudrait des milliards d’informations (320 milliards d’affichages exactement) afin de prendre une bonne décision. Or les algorithmes de Criteo travaillent avec des jeux de données plus réduits. Les Data Scientists de Criteo définissent dans le même temps les bons algorithmes de calcul prédictif afin de prévoir le comportement des internautes vis-à-vis des bannières publicitaires qu’on leur propose.
Côté entreprises utilisatrices, on identifie également la nécessité des Data Scientists. Valérie Abrell-Duong, en charge des solutions de CRM chez Procter & Gamble, constate « qu’il y a besoin de statisticiens pour créer des algorithmes. » Elle s’exprimait pour sa part lors d’un événement Big Data organisé par Supelec Numérique, le 14 Novembre.
Il y aura toutefois un effort de rapprochement à effectuer du côté des métiers également. « Entre le marketeur et le Data Scientist, il y a un gap énorme. Il faut que les marketeurs pensent out-of-the-box. Ils n’y sont pas du tout » prévient Christine Ballagué, qui anime la chaire de réseaux sociaux à Télécom Ecole de Management. Elle s’exprimait lors de l’événement Big Data organisé par l’Aproged et la Big Data Alliance, le 14 Novembre. « C’est au niveau des études marketing qu’il faut des Data Scientists » préconise en réponse Caroline Faillet, fondatrice du cabinet conseil Bolero.
Former des Data Scientists va prendre du temps
Le Data Scientist est encore une denrée rare. L’institut Mines Télécom a débuté cette année sa première formation de Data Scientists dans le cadre d’un Master spécialisé. Mais la première promotion ne concerne que 30 étudiants. Ce Master a été créé par Stephan Clemençon qui l’a présenté le 14 novembre, lors de l’événement Big Data de l’Aproged et de la Big Data Alliance.
Conscient de l’importance de la demande en matière de Data Scientists, il annonce qu’il va mettre en place une formation continue et un « certificat de Data Scientist » pour les gens qui sont en poste. « Les problèmes liés au Big Data concernent les infrastructures et les briques à assembler. L’idée est de sortir du carcan disciplinaire, pour être multi-casquettes comme on peut l’être dans une startup. Nous allons former des gens qui sont des Data Scientists ou des entrepreneurs en employant les outils existants » décrit-il. Pour les étudiants il s’agit d’acquérir un socle de connaissances techniques, côté informatique et machine-learning, et business conduisant à l’exercice opérationnel du métier de Data Scientist.
Connaître la programmation, les statistiques et l’algèbre linéaire …