Afin de réussir ses projets d’IA, le groupe pétrolier TotalEnergies a mis en place une méthodologie et une organisation pour répondre aux challenges de la qualité des données insuffisante, du manque d’implication des métiers, ou simplement d’absence de valeur ajoutée.
Passer de la preuve de concept (PoC ou Proof of concept) à l’industrialisation, est le défi posé par les projets d’IA. Beaucoup de projets tournent court du fait de nombreux facteurs alors qu’ils étaient extrêmement prometteurs lors des démonstrations et des évaluations.
Une équipe de 40 personnes dédiées aux projets d’IA
Avec une équipe de 40 personnes dédiées aux projets IA dans sa Digital Factory, TotalEnergies est une entreprise française particulièrement active dans le domaine et, comme chez tous les pionniers d’une technologie, ses équipes ont essuyé les plâtres.
« Il ne faut pas vouloir absolument mettre de l’IA dans tous les projets«
Or cette approche peut s’avérer délétère dans une entreprise dont la finalité n’est pas de commercialiser des logiciels mais de créer de la valeur. Florian Bergamasco pointe comme obstacles à la réussite le manque d’implication des utilisateurs, l’absence de désirabilité qui va torpiller l’adoption de la solution ou encore la qualité des données qui n’est pas toujours au rendez-vous.
Une approche en 5 phases
Pour ne pas tomber dans ce type de piège et surtout s’assurer que les PoC (Proof of concept) aboutissent effectivement en applications déployées et utilisées par les opérateurs, TotalEnergies a réfléchi à une organisation. Elle sert à identifier les cas d’usage qui dégageront le plus de valeur et ceux qui transformeront les usages métiers.
« Cette phase va préparer les opérateurs qui peuvent être très loin du digital ou même d’Excel »
L’objectif est de préparer les futurs utilisateurs d’IA et faciliter leur adoption de ces outils. « Nous avons des sessions Maker Workshop [atelier de création] lors desquelles n’importe quel collaborateur qui n’a jamais mis les mains dans le code ou qui utilise à peine Word va pouvoir faire son premier modèle de Machine Learning » dit-il.
Un processus d’idéation pour identifier les cas d’usage ayant de la valeur
Le véritable travail sur les cas d’usage intervient lors de la phase d’idéation. L’idéation est le processus humain créatif de production de nouvelles idées. Il s’agit alors d’identifier les cas d’usage qui vont véritablement dégager de la valeur pour l’entreprise et transformer les métiers.
La méthodologie Design Data HBDS vise à identifier les flux d’information dans l’entreprise
« Quand une personne parle à une autre, c’est une information, mais pas nécessairement une Data. Qu’un système communique avec un autre est aussi une information » explique-t-il. « Comme cela on constitue un millefeuille qui permet ensuite d’identifier les flux et de voir les points qui peuvent être améliorés, transformés et ainsi identifier un cas d’usage transformant pour le métier » décrit-il.
70% des Data Scientists TotalEnergies sont des explorateurs
A la suite de cette phase d’idéation, les Data Scientists vont cadrer l’idée avec une analyse de type « Data 360 » pour enfin arriver à la phase d’exploration. « Aujourd’hui, 70% de nos équipes travaillent sur cette phase d’exploration. Ils vont s’assurer qu’il n’y a pas de problèmes d’accès à la donnée, que celle-ci est bien gouvernée » prévient-il.
« Il faut évaluer l’accompagnement qui devra être mis en place pour aider les collaborateurs à adopter la solution »
Cette phase Exploration ne consiste pas à réfléchir à un modèle en mode bac à sable. Il s’agit d’évaluer l’industrialisation du modèle et de déterminer les données minimales qui seront nécessaires pour obtenir un maximum de performances. « On prépare ainsi le Scale [le passage à grande échelle du projet] et il faut privilégier une approche généraliste. Il ne sert parfois à rien d’ajouter plus de 3 sources de données s’il s’agit de gagner 2% de performance additionnelle. Le passage à l’échelle n’en sera que plus compliqué » alerte-t-il.
Privilégier la simplicité plutôt que la sophistication
En tant qu’expert de l’IA, il privilégie la simplicité à un excès de sophistication. « Parfois, une simple régression linéaire suffit à répondre à un besoin. Le coût de l’industrialisation et le FinOps [gestion financière des outils informatiques] n’en seront que meilleurs et on rendra le cas d’usage pérenne bien plus facilement » dit-il. Une fois ces trois phases achevées, le projet bascule en mode « Build » (réalisation).
Une organisation dynamique a été mise en place pour entretenir la flamme des Data Scientists
Désormais, les Data Scientists sont répartis en 2 « Squads » (équipes). Il y a d’une part les Data Scientists dédiés à un produit. Leur objectif est de porter un projet jusqu’à son industrialisation. D’autre part, des Data Scientists sont dans les Squads d’exploration. Ceux-ci sont au service de 2 produits. 2 Data Scientists sont affectés à un produit pour garder une certaine flexibilité dans l’équipe et maintenir l’attractivité du travail.
La méthode Data 360 sert à passer de l’idée au produit
La méthode Data 360 est mise en œuvre par TotalEnergies pour passer du stade de l’idée à celui du produit. « Un Data Scientist qui est en phase d’idéation et fait le Data 360 va peu à peu explorer le sujet, tester son prototype avec l’utilisateur. Il va décrocher la validation du management afin d’industrialiser son cas d’usage. Il va le développer, le rendre pérenne » présente Florian Bergamasco.
Le roulement entre les Squads vise à stimuler la curiosité des Data Scientists et à limiter les départs
« Les Data Scientists des Squads d’exploration peuvent venir en support si un modèle dérive en phase support et présente un risque opérationnel. Le rôle de cette Squad d’exploration est aussi de monitorer et suivre l’évolution des modèles dans le temps » ajoute Florian Bergamasco. TotalEnergies compte aujourd’hui 600 modèles d’IA industrialisés, 30 à 40 projets sont en phase d’exploration. Près de 100 idéations ont été menées à ce jour.