L’IA générative RAG s’apprête à améliorer la recherche d’informations chez TotalEnergies

Aude Giraudel, Head of smart search engines chez TotalEnergies, 21 novembre

TotalEnergies fait monter en puissance ses outils de recherche d’informations en y greffant de l’IA générative de type RAG (Retrieval Augmented Generation ou Generation Augmentée de Récupération).

Le RAG transforme la manière de rechercher l’information


L’IA générative RAG apporte des réponses synthétiques et permet de remonter aux documents sources.  « Je dirais que le RAG, chez nous, c’est en train de transformer la manière dont les gens recherchent l’information » annonce Aude Giraudel, Head of smart search engines chez TotalEnergies (responsable des moteurs de recherche intelligents). Elle a pris la parole le 21 novembre lors d’un événement organisé par Sinequa, spécialiste des moteurs de recherche.



« Le RAG, c’est un gain de temps important tout en conservant le volet confiance« 

« Cela [Le RAG] permet de gagner un temps évident. Si on interroge nos utilisateurs, ce qu’ils nous disent en premier lieu, c’est qu’en effet, c’est un gain de temps important tout en conservant le volet confiance » poursuit-elle. « On a toujours la possibilité de retourner vers la source d’information, de vérifier que les informations qui sont produites par le RAG sont vraiment valides. C’est vraiment un gain de temps en toute sécurité » dit-elle.

La responsable décrit ainsi le nouvel assistant de TotalEnergies baptisé Jafar, en référence à un personnage du dessin animé Aladdin. L’outil Jafar est l’association de l’IA générative et du moteur de recherche de Sinequa avec qui TotalEnergies travaille depuis dix ans. « Jafar va arriver en production d’ici cette fin d’année » annonce-t-elle. Jafar signifie « Jenerative AI for Availability REX » (IA générative pour la disponibilité REX).


L’IA générative RAG est associée au moteur de recherche Sinequa afin d’avoir la bonne information sur les sites de TotalEnergies (Image TotalEnergies)

Une dizaine de personnes travaillent sur les moteurs de recherche

Aude Giraudele est responsable d’une équipe en charge de développer les solutions de recherche d’informations pour la compagnie TotalEnergies. Il s’agit d’une équipe d’une dizaine de personnes qui s’appuie sur la solution Sinequa pour développer les solutions de recherche en interne pour l’ensemble des métiers techniques.

Les données de TotalEnergies sont non structurées techniques, avec du texte, des tableaux, des images et des schémas

Il s’agit de valoriser le patrimoine documentaire de TotalEnergies qui est majoritairement technique. Ces données sont techniques et non structurées, avec du texte, des tableaux, des images, des schémas. Autre spécificité, le vocabulaire utilisé comprend des termes techniques, avec des acronymes, etc. « Il y a à la fois la forme et le fond qui sont difficiles à capter » souligne la responsable.

Les contenus deviennent d’ailleurs de moins en moins structurés. « On est en train de passer à des formats encore plus mixtes et encore moins rédigés, encore moins structurés que sont finalement les présentations PowerPoint alors qu’auparavant, on avait plutôt des rapports qui étaient bien rédigés, même si c’était des contenus mixtes  » ajoute-t-elle. Les contenus sont encore plus difficiles à « attraper ».  Sinequa permet d’attraper ces types de contenus. « Les contenus très, très non structurés sont quand même très difficiles à capter » prévient toutefois la responsable.

Raffinerie de TotalEnergies à Donges (44) (Photo TotalEnergies)

La bonne information au bon moment pour réduire les risques

La recherche d’information est critique chez TotalEnergies notamment afin de réduire les incidents. L’équipe de Aude Giraudele mène par exemple un projet de portail de recherche avec les personnels en raffinerie. Lorsqu’il survient des incidents, les personnels doivent documenter ces incidents et rédiger un retour d’expérience. Ces retours d’expérience sont des documents qui décrivent les causes, les conséquences de l’incident et les actions qui ont été menées pour remédier à ce type d’incident. Il y a eu un incident en 2021 sur la raffinerie d’Anvers.

Un incident similaire avait été documenté 4 ans auparavant mais malheureusement il n’y avait pas de moteur de recherche

C’était une fissure sur un des équipements de la raffinerie. Cet incident a causé une interruption de service de plusieurs jours et engendré des pertes assez importantes pour la plus grande raffinerie d’Europe de TotalEnergies. Il se trouve que le même type d’incident s’était produit quatre ans auparavant. Les opérateurs s’en sont aperçus en regardant les documents qui étaient capitalisés. C’était donc documenté mais malheureusement, à cette époque-là, il n’y avait pas de moteur de recherche.

« Et pour autant, c’était documenté. Et donc, probablement, on aurait pu éviter ce risque industriel. Et c’est à ce moment-là que les équipes d’Anvers nous ont dit : ‘il faut que l’on ait une solution pour vraiment utiliser tout ce patrimoine documentaire, toute cette connaissance qu’on a capitalisée dans nos documents‘ » décrit la responsable.  Le but est d’éviter que les mêmes événements se reproduisent à des années d’intervalle et ainsi réduire les risques industriels.

Inspection des soudures d’alimentation des brûleurs dans la raffinerie de Normandie de TotalEnergies (Photo Patrick Boulen TotalEnergies)

Un moteur de recherche traditionnel orienté métiers

« C’est de là que nous avons créé tout d’abord un moteur de recherche que l’on peut appeler standard » dit-elle. « Maintenant, avec l’arrivée de l’IA générative cela devient un petit peu vieux jeu. mais pour autant, c’est un moteur de recherche très important, très orienté métier dans lequel on a vraiment travaillé avec eux pour identifier la bonne manière de retrouver la bonne information » commente-t-elle.

« On permet de retrouver l’ensemble des documents qui sont liés à un site, à un équipement en particulier »

Cela a consisté à extraire automatiquement les objets métiers qui étaient d’intérêt pour les personnels, avec les sites, les unités qui les intéressaient, les équipements etc. « C’est un portail métier qui est complètement adapté au sujet opérationnel sur les sites » retient-elle. Cette version fonctionne avec une recherche par mot clé comme « avarie » ou « problème ». « On permet de retrouver l’ensemble des documents qui sont liés à un site, à un équipement en particulier, notamment parce qu’on a travaillé sur la problématique métier » précise-t-elle.

« Un opérateur qui va intervenir sur site, intervient sur un type d’équipement particulier. On lui propose un filtre directement sur le bon équipement, ça lui permet d’avoir directement accès à un ensemble de documents pertinents pour sa recherche et de pouvoir en prendre connaissance » décrit-elle.  

Les opérateurs sont satisfaits de la solution

« La solution est très efficace. Les opérateurs sont très satisfaits de cette solution, mais pour autant, il y a quand même un temps non négligeable qui est un peu perdu à prendre connaissance de tous ces documents » poursuit-elle. C’est là que le RAG apporte aussi un progrès. « Il faut consulter ces documents. Et c’est là que le RAG, finalement, est en train de transformer l’expérience utilisateur de nos opérateurs sur site » annonce-t-elle.

« Cela va permettre à nos opérateurs d’interroger ce même patrimoine documentaire en langage naturel et d’avoir une réponse synthétique »

En greffant du RAG au portail de recherche cela change la donne. « Cela va permettre à nos opérateurs d’interroger ce même patrimoine documentaire en langage naturel et d’avoir directement une réponse synthétique qui correspond à leurs préoccupations » annonce-t-elle en effectuant une démonstration du nouvel outil Jafar. Elle décrit un opérateur qui doit intervenir sur une unité de distillation. Cette unité peut présenter des risques importants, liés à la nature inflammable des produits qui sont manipulés. « On interroge ‘Y a-t-il eu des incidents par le passé liés  à ce type d’installation ? » illustre-t-elle.

« L’opérateur interroge Jafar en lui disant : ‘Bonjour Jafar, est-ce que par le passé, nous avons eu des incidents de type feu sur des colonnes de distillation ?’ Jafar va aller chercher la connaissance dans le patrimoine documentaire. Ce sont les documents de retour d’expérience, les analyses des causes racines, et il va ramener finalement une synthèse de tout ce qu’il a pu trouver » poursuit-elle.

Deux incidents majeurs retrouvés par Jafar

Elle poursuit la démonstration de Jafar. « On voit qu’il a trouvé deux incidents majeurs. Un premier sur une raffinerie en Allemagne qui s’appelle Leuna et un second sur une raffinerie en France qui s’appelle La Mède, dans le sud-est de la France. Et on voit que les réponses sont très bien structurées » dit-elle.

« Le cœur de la valeur qu’on apporte avec le RAG, c’est finalement le travail qu’on fait à l’indexation« 

On voit ainsi sur l’incident sur la Mède, la date de l’événement, la description de l’incident, les conséquences, etc.  « Le cœur de la valeur qu’on apporte avec le RAG, c’est finalement le travail qu’on fait à l’indexation » explique Aude Giraudel. « Ce travail d’indexation nous a permis notamment d’aller extraire automatiquement la date de l’événement, le lieu de l’incident, les conséquences, les causes, etc. Et ces informations, nous les avons stockées dans l’index et cela nous permet après, quand on interroge l’IA générative, de pouvoir lui donner cette information que finalement, on a déjà dans notre index, le lieu de l’incident, la date de l’événement, etc » détaille-t-elle. « Et on dit à l’IA : structure-nous la réponse en nous donnant tous ces éléments. »

Autre nouveauté apportée par Jafar ce sont les images. « C’est un travail que nous avons mené avec Sinequa pour faire de l’analyse d’images et pouvoir ajouter des visuels dans les réponses » pointe-t-elle. « C’est particulièrement intéressant dans le cas de questions où, par exemple, on a des visuels de type schéma qui permettent d’apporter de l’information complémentaire à la réponse ».

Echanges avec l’assistant Jafar afin de mieux cerner les conséquences de l’incident

L’assistant Jafar permet ensuite de continuer les échanges avec l’opérateur afin d’avoir une vue complète de ce qui s’est passé. L ‘opérateur peut demander, dans ces incidents, qu’elles ont été les conséquences, et notamment les pertes financières. « Et là, on voit que finalement, notre assistant Jafar continue à nous répondre en nous citant toujours les deux mêmes incidents avec une réponse très structurée ».

Les opérateurs ont finalement une vue synthétique d’un un document en particulier

Les opérateurs ont ainsi une vue synthétique d’un document en particulier. « Ils ont vraiment besoin d’accélérer la prise de connaissance et la lecture d’un document et avoir finalement une synthèse directement de ce qui est contenu dans un document. Et là, on voit que cette synthèse est structurée » termine-t-elle. C’est donc là que le RAG permet de gagner du temps.

Pour l’avenir, l’enjeu est la gestion du changement et l’adoption de ces nouveaux outils par les équipes métiers, souligne la responsable. « Le gros défi pour nous, ça va être avec ces outils qui arrivent en production, d’écouter nos utilisateurs, de comprendre les usages et de réagir et de tracer la route pour que l’adoption se fasse massivement dans de bonnes conditions et que ces assistants aident le plus largement possible les collaborateurs de TotalEnergies » conclut-elle.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *