« La culture de la donnée et du prédictif doit émaner du top management »


Le Machine Learning se démocratise afin de réaliser des prédictions business. Reste à convaincre les décideurs en entreprise. C’est ce que constate Louis Dorard, expert du domaine. Il interviendra le 21 Mai lors de la première conférence Européenne dédiée aux applications et API prédictives, “PAPI Connect” dont La Revue du Digital est partenaire. 

Question : quelle est la différence entre le Machine Learning et le scoring prédictif pratiqué jusqu’à présent ?

Louis Dorard : les deux sont très liés car le scoring prédictif se réalise grâce au Machine Learning. Le scoring consiste à quantifier à quel point on pense qu’un objet donné (input) va présenter une certaine caractéristique (output). On donne alors une note, un « score », entre 0 et 1. Par exemple, est-ce qu’un client va renouveler son abonnement à un service ou pas ? Sera-t-il intéressé par tel ou tel produit ?


Afin d’effectuer de telles prédictions, on analyse les données passées qui servent d’exemple. Le but est de trouver des relations entre les attributs des inputs et les outputs associées. Or, le Machine Learning réalise ces tâches automatiquement. La machine « apprend » ces relations en parcourant les exemples qu’on lui donne. Il n’y a pas besoin de programmer un quelconque système de règles.

Parfois, la distinction entre Machine Learning et scoring se fait selon le domaine d’application. Quand on a besoin de prédire si l’input a la caractéristique recherchée, mais pas tant de donner un « score », on peut parler de classification.


L’apprentissage permet aussi d’aborder d’autres problèmes de prédiction. Il y a ainsi la régression où il faut prédire un nombre qui n’est pas forcément entre 0 et 1, par exemple quand il s’agit de prédire l’affluence dans les lieux publics. On trouve aussi la segmentation, afin de segmenter des clients selon des attributs qui les représentent. Et on trouve la détection d’anomalies, pour la prévention de pannes ou de fraudes.

Le Machine Learning peut enfin s’appliquer sur des données non structurées afin de classifier du texte, du son, des images, ou de traduire des requêtes exprimées en langage naturel vers une action exécutable par une machine. C’est ce que font les assistants personnels à la Siri d’Apple et Cortana.

Question : où est la différence avec des outils comme ceux de SPSS d’IBM ou de SAS ?

Louis Dorard : un changement depuis l’âge d’or de SPSS et de SAS est l’accessibilité croissante des techniques, via des langages ouverts comme R, Python, Scala, et de nouvelles bibliothèques de fonctions disponibles en Open Source.

Récemment, de nouveaux services vont encore plus loin dans la simplification du Machine Learning. On leur envoie des données d’apprentissage, des inputs et des outputs, et un modèle prédictif est créé automatiquement.

On peut ensuite questionner le modèle en envoyant de nouveaux inputs et en récupérant des prédictions d’outputs. C’est le cas d’Amazon Machine Learning lancé le mois dernier, ainsi que de ses concurrents BigML et de la startup française PredicSis. Ils ont pour but de démocratiser le Machine Learning.

Question : quel exemple avez-vous expérimenté de la puissance du Machine Learning ?

Louis Dorard : historiquement, seuls les grands opérateurs télécoms savaient prédire quels clients risquaient de mettre un terme à leur abonnement grâce au scoring. Or, on voit aujourd’hui des PME et même des startups appliquer les mêmes techniques, rendues beaucoup plus accessibles.

C’est ce qu’on appelle le « churn prediction« . Typiquement, ces prédictions sont utilisées pour des campagnes d’appels sortants visant à conserver les clients. J’ai en tête un exemple où le churn prediction augmente de 11% le succès de ces campagnes, ce qui se traduit en centaines de milliers d’euros gagnés par an pour une société dont le chiffre d’affaires est d’environ 10 millions d’euros, c’est loin d’être négligeable.

Il y a ensuite tout ce qui est automatisation des traitements manuels, qui permet aux équipes opérationnelles de réaliser leurs tâches en moins de temps et donc de réduire les coûts. La catégorisation de documents et le filtrage par priorité sont des cas d’usage populaires.

Par exemple, on peut grâce au Machine Learning router automatiquement les requêtes reçues par une équipe de support client vers les personnes qui pourront les traiter au mieux, ainsi que leur indiquer la priorité de chaque requête en vue de réponses plus rapides. Pour des entreprises qui reçoivent des milliers de requêtes par mois, l’économie de temps peut être comptée en centaines d’heures.

Question : quelles sont les prochaines étapes avant que le Machine Learning ne devienne banal dans les entreprises ?

Louis Dorard : les cas d’usage dont je parlais deviennent facilement applicables. On voit apparaitre des solutions spécialisées sur certains problèmes métiers surtout dans le marketing, y compris côté Open Source, notamment avec PredictionIO.

On a réussi à faire sortir le Machine Learning du cadre de la recherche et du développement. Même pour la prédiction d’affluence dans certains lieux publics, des gares ou des stations de vélo, les solutions qui étaient propres à chaque ville sont en train de devenir duplicables. Il faut maintenant évangéliser pour que les gens prennent conscience des possibilités du Machine Learning et du prédictif.

Ceci étant dit, il reste pas mal de cas d’utilisation innovants du Machine Learning qui relèvent de la R&D. Même si les techniques sont très accessibles et même si on arrive à formuler un problème utile pour le métier, il reste parfois à vérifier que les données collectées sont assez bonnes pour créer des modèles prédictifs de qualité. J’observe depuis cette année plusieurs sociétés en France qui sont dans des périodes de réalisation de preuves de concept (POC Proof of Concept) et pas encore prêtes à déployer en production.

Enfin, tout ceci présuppose qu’on sache quels problèmes cibler avec le Machine Learning afin d’atteindre des objectifs métiers. Il ne suffit pas que les profils techniques des entreprises aient connaissance de l’implémentation du Machine Learning. Il faut que les décideurs aient connaissance de ses possibilités ainsi que de ses limites. Les entreprises doivent développer une culture de la donnée et du prédictif, et cela doit émaner du top management.

Question : par quoi faut-il commencer pour mettre en place du Machine Learning ?

Louis Dorard : le plus gros problème n’est pas tant de faire tourner les algorithmes, mais de définir quelles prédictions seront utiles pour le métier. Il faut commencer par s’inspirer d’autres cas d’usage, avant de développer le sien.

Certains services permettent d’accéder à des modèles prédictifs déjà existants et sont les plus simples à utiliser. Cela peut convenir pour du filtrage de spam ou de l’analyse de sentiment par exemple qui seront les mêmes pour mon entreprise ou pour une autre.

Ensuite, on peut tester des solutions spécifiques qui vont se nourrir des données propres de l’entreprise, par exemple des solutions de « churn prediction » comme ChurnSpotter.io, de « lead scoring », ou de détection de fraude. Enfin, on peut vouloir mettre en place sa propre solution à partir de services plus génériques qui permettent d’adresser des problèmes différents comme PredicSis, BigML, ou PredictionIO dans l’Open Source.

20% de réduction pour les lecteurs de La Revue du Digital

Louis Dorard est consultant indépendant, expert du Machine Learning et auteur du livre « Bootstrapping Machine Learning. »

Les services et les outils dont il parle seront présentés lors la conférence PAPIs Connect le 21 mai à Paris, via de nombreux cas d’usage, et des discussions avec des experts sur les aspects globaux et métier de la mise en place du prédictif, sans entrer dans la technique.

La Revue du Digital est partenaire de cette conférence. Ses lecteurs bénéficient d’une réduction de 20% sur les frais d’inscription, avec le code « RevueduDigital » sur www.papis.io/connec

William El Kaim

William El Kaim est expert reconnu de la transformation digitale. Consultant indépendant, et auteur pour la Revue du Digital, il a exercé les responsabilités de "Marketing Technology Director" dans le domaine du voyage d'affaires. Il a contribué à l'invention de multiples concepts et produits digitaux, ainsi qu'au déploiement réussi d'un réseau social d'entreprise.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *