Passer en quelques mois d’une donnée silotée peu valorisée à une stratégie d’IA générative qui rivalise avec celle de Netflix, c’est le défi relevé par le Chief Data Officer de M7 Group, filiale européenne du groupe Canal +. C’est une approche pragmatique totalement tournée vers les Quick Win.
Embauché il y a 18 mois par M7 Group, la branche européenne du Groupe Canal+ (Hors France et Pologne), Mohamed Lemine Beydia, Head of Data & Analytics chez Canal+ Group est chargé d’accélérer la transformation Data de l’entreprise.
En migrant vers l’OTT (Over The Top) et la TV sur les box des opérateurs, tout change
Beaucoup de données peuvent être collectées quant aux habitudes des abonnés. Ce changement de paradigme a poussé M7 Group à accélérer sa transformation Data. « Lorsque nous avons entrepris cette transformation, la donnée était très dispersée entre différents silos et peu de process en place. Nous n’étions pas encore une entreprise orientée Data et les cas d’usage s’appuyaient essentiellement sur Microsoft Power BI et Excel. »
Pas de temps pour construire une fondation pour toutes les données
Partir de zéro pour aller jusqu’à l’IA générative en production, tel était le défi à relever par le responsable Data. « En Data, le principe du ‘Garbage in’/’Garbage out’ s’applique. Si vous avez des données de mauvaise qualité en entrée, peu importe l’IA qui sera mise en œuvre, les résultats ne seront jamais satisfaisants » rappelle-t-il.
« C’est un dilemme classique : va-t-on passer 2 ou 3 ans à bâtir des fondations sans livrer de cas d’usage ? »
La première tâche de l’équipe Data a été d’identifier toutes les tâches où l’IA pouvait apporter de la valeur à l’entreprise. Les grands domaines retenus ont été l’acquisition de clients, l’amélioration de l’expérience, le développement de la relation client, la rétention, la stratégie de contenu pour studio Canal et l’achat de contenus, ainsi que l’automatisation des process et la conformité.
Identifier les projets Quick Wins avec les métiers
La démarche a été d’identifier les Quick wins avec les métiers. « Nous avons collecté des cas d’usage avec les métiers dans chacun de ces domaines et classé ceux-ci dans une matrice avec l’effort à délivrer en abscisse et l’impact en ordonnée. Cela nous a permis de repérer les Quick-Wins, les cas d’usage qui auront un fort impact business, mais dont l’effort à délivrer est minime » explique-t-il.
« Nous avons mis en place un Data Lake avec une gouvernance de la donnée minimaliste »
En parallèle, une IA Factory est constituée. Une IA Factory avec 10 % d’experts en IA seulement. Elle se compose de 6 strates. Au sommet, le comité de pilotage regroupe toutes les directions métiers, l’équipe IA et Data et un représentant du CTO (Chief Technology Officer). L’objectif est de décider quels cas d’usage iront jusqu’en production. Vient ensuite un réseau d’ambassadeurs composé à 90% d’utilisateurs métiers passionnés par la Data et l’IA. Ceux-ci ont pour mission de promouvoir l’IA dans leurs Business Units et collecter les demandes dans les 52 pays où est présent le groupe.
Les experts IA ne représentent que 10% de l’organisation
La strate technologie vise à mettre en place un cadre pour l’IA. Un volet formation est pour sa part mené par la DRH. Enfin, les dimensions sécurité et expertises IA viennent compléter le dispositif. « Comparée aux IA Factory du passé composées à 90 % de Data Scientists et Data Engineers, ici les experts ne représentent plus que 10 % de l’organisation. Cela met en exergue qu’il s’agit d’un cheminement réellement collectif vers l’IA » souligne le responsable.
Lors des 6 premiers mois, les premières missions ont été de définir les outils qui allaient être utilisés
Un cadre standardisé a été défini pour les équipes de développement avec les équipes sécurité et les métiers, tout en veillant à garder une certaine agilité. « Un point très important a été de mettre en place un cadre d’évaluation des projets. Quant on mène un PoC [Proof of Concept ou preuve de concept], il faut être capable d’évaluer le retour sur investissement du projet » pointe-t-il.
Le projet est mis de côté si le développement est supérieur à 6 mois
« On peut estimer le coût d’un projet d’IA générative avec les token dépensés, mettre en place une approche FinOps [Suivi des indicateurs financiers] en tenant compte du coût du projet, mais aussi du Time to Market nécessaire. » La règle appliquée est particulièrement simple : tout cas d’usage dont le développement va dépasser 6 mois est mis de côté pour plus tard.
« L’idée était de ne pas restreindre les équipes à un seul LLM, notamment pour éviter de devenir dépendant à OpenAI«
L’objectif était de disposer d’une gamme de LLM parmi lesquels choisir. « Nous avons souhaité diversifier les LLM [Large Language Models], avec des modèles de petite taille sur des cas d’usage simples et des LLM plus puissants sur des cas d’usage plus complexes » indique-t-il. M7 Group développe des applications sur la plateforme Cloud d’AWS (Amazon Web Services) et a accès à de multiples LLM via la plateforme Bedrock d’AWS. C’est en phase de preuve de concept (PoC) que le choix du LLM est entériné par l’équipe projet.
L’IA générative accélère le développement de code logiciel
Aujourd’hui, 35 % des cas d’usage de l’IA générative chez M7 Group portent sur la génération de code, 20 % sur la recherche et l’extraction de données avec des RAG (IA générative avec génération augmentée de récupération connectée aux données de l’entrprise), 15 % pour les chatbots, 15 % pour les transformations de données.
« Là où un PoC demandait de 3 à 6 mois de développement, ceux-ci sont menés en un mois seulement aujourd’hui »
En ce qui concerne les contenus, l’apport de l’IA générative est également important. « La transformation de données est un autre cas d’usage intéressant. Nous utilisons l’IA générative pour générer des données, comme par exemple les métadonnées à partir du fichier d’un film, avec la liste des acteurs, le thème du film, des données qui vont ensuite alimenter le moteur de recommandation. ». Dans le même temps, l’IA analytique classique est pour sa part toujours utilisée pour réaliser des prévisions, pour le scoring, la segmentation, l’analyse prédictive, la détection d’anomalies et l’optimisation des campagnes.
Des cas d’usage développés en quelques mois
Parmi les premiers cas d’usage à avoir été livrés par l’AI Factory, figure une application d’automatisation du marketing, Marketing Automation développée en 2 mois seulement. Celle-ci met en œuvre un modèle d’IA générative pour recommander des contenus à l’abonné, et les proposer soit par push mobile, soit par e-mail. Cette IA générative exploite à la fois les données d’usage du client, des données CRM, ainsi que des données externes. Le temps de visionnage s’est accru de 30 % pour les personnes utilisant ce service de notification.
L’abonné peut trouver un contenu en fonction des thèmes, des acteurs, avec une certaine tolérance aux erreurs de saisie
Enfin, le projet de Chatbot de support client a demandé 6 mois de travail. Il est aujourd’hui en production dans 20 pays et dans 12 langues différentes. L’IA générative est aussi évaluée pour le Dubbing, c’est-à-dire la traduction et le sous-titrage des contenus. Mohamed Lemine Beydia évoque une architecture avec un LLM de traduction et un « LLM as Judge » pour évaluer la qualité de la traduction.
On peut obtenir des résultats probants même sans fondation Data solide
« L’impact de la Data sur le business est directement corrélé au niveau de la maturité Data. Plus vous êtes matures, plus vous pouvez espérer un impact fort. Cela dit, le paradoxe est qu’il n’est pas nécessaire d’avoir une fondation Data solide pour obtenir des résultats probants » conclut Mohamed Lemine Beydia, Head of Data & Analytics chez M7 Group, Groupe Canal+.