Il est difficile de comprendre en quoi consiste le travail d’un Data scientist au quotidien ou lors d’une mission. L’institut de sondage BVA a présenté quelques personnages stéréotypés, mais pas si loin de la réalité, le 18 mars à Paris à l’occasion de la présentation de sa nouvelle offre d’analyse Data Science. Mathieu Dombrie, head of Data Analytics de BVA et Marie Laure Soubils, DGA de BVA services ont pris la parole.
Taux de satisfaction
Ils ont cité en particulier comment les objectifs d’un patron de point de vente ont été revus en ce qui concerne la satisfaction client afin de tenir compte de la réalité de sa situation particulière. Une solution qui aura été trouvée après le recours à l’analyse avancée de données, et un retour sur le terrain.
L’histoire, vraie, débute par une chaîne de restauration qui décide de mettre en place une évaluation systématique du taux de satisfaction de ses clients et de s’en servir afin de calculer les primes des gérants de ses points de vente. Concrètement, la satisfaction client est recueillie à chaud, à la sortie des restaurants, avec une saisie des informations via des tablettes.
« Houston on a un problème »
La première question qui se pose alors à la chaine de restauration est de définir le taux minimum de satisfaction à atteindre pour accorder ces primes. Comme elle dispose de plusieurs années de données, le Data scientist commence son travail en calculant les taux de satisfaction prévisibles.
Or, il constate que le taux de satisfaction d’un restaurant s’écroule brusquement en Juillet. Le gérant de ce dernier perd sa prime et remet alors en question les enquêteurs, le processus de collecte, etc. Face à un problème de ce genre, la première réaction du Data scientist est de vérifier la qualité de ses données.
Données exogènes
Si elles sont correctes, il cherche alors à récupérer des données exogènes, extérieures, comme les variations climatiques, le chiffre d’affaire des magasins, le taux de fréquentation, etc…, en collaborant avec l’entreprise cliente de BVA et le responsable de l’étude.
Une fois toutes les données disponibles intégrées, vient la phase d’enquête. Le Data scientist adopte une approche en série temporelle. Et il découvre que cette baisse du taux de satisfaction a déjà eu lieu à la même période l’année précédente. Le responsable de l’étude émet alors l’hypothèse d’un lien avec la saisonnalité.
Pas d’influence de la saisonnalité
Malheureusement, cette idée est démentie par le Data scientist, qui démontre – via la méthode de Box-Jenkis – que la saisonnalité n’a pas d’influence sur le taux de satisfaction. Les données exogènes corrélées au taux de satisfaction ne donnent rien non plus, excepté que le taux de satisfaction baisse quand la fréquentation augmente, mais uniquement en Juillet.
A ce moment précis, le Data scientist passe la main à ses collègues. Il faut alors retourner sur place et comprendre avec d’autres approches, sociologiques, comportementales, etc. ce qui a bien pu se passer.
Des travaux
En fait, il se trouve que chaque année en juillet, des travaux avaient lieu sur le parking. Or les clients s’exprimant sur leur satisfaction globale ont mémorisé leur mauvaise expérience. Comme des travaux auront encore lieu en juillet l’année suivante, on finit par demander au Data scientist de recalculer le taux de satisfaction à atteindre en prenant en compte ce problème spécifique au mois de juillet afin que le patron du restaurant en question ne soit pas injustement pénalisé.
William El Kaim
William El Kaim est expert reconnu de la transformation digitale. Consultant indépendant, et auteur pour la Revue du Digital, il a exercé les responsabilités de "Marketing Technology Director" dans le domaine du voyage d'affaires. Il a contribué à l'invention de multiples concepts et produits digitaux, ainsi qu'au déploiement réussi d'un réseau social d'entreprise.
Sans vouloir paraître déçu (j’adore le titre de votre article) par l’analyse présentée par les gens de BVA, il ne s’agit que d’un niveau normal d’enquête menée par un contrôleur de gestion opérationnel aguerri. Travaillant depuis 20 ans avec les départements du contrôle de gestion de plusieurs enseignes de distribution spécialisée, je puis confirmer que
1) les données externes font partie des facteurs de compréhension du marché (D’ailleurs la liste des indicateurs « Open Data » pertinents se garde jalousement… Dont les fameuses variables explicatives),
2) le benchmark y est pratiqué de manière très sophistiqué (les contrôleurs de gestion font de subtiles analyses « à périmètre constant » – permettant de « neutraliser d’éventuelles injustices » comme vous l’écrivez),
3) chaque année un lourd travail préalable de recalage de l’historique (retraitement de comparabilité) permet de sortir des analyses temporelles réellement pertinentes
Pour aller au-delà de cette présentation d’enquête classique déjà menée par les opérationnels de la mesure de performance, le Data Scientist doit apporter d’autres outils et d’autres méthodes. Mais j’apprécie la volonté d’explication pédagogique de ce cas pratique imaginé par cet homme « Head of Data Analytics » chez BVA.
Cordialement