Pouvez-vous nous présenter vos principales missions chez Total ?

Je suis Pierre Jallais, je travaille au sein de la division Technology Group de Total, rattachée à la Holding et plus spécialement Stratégie & Innovation, en charge de l’ensemble des sujets liés à la recherche, l’innovation et le NLP.

Total est un groupe multi-énergies présent dans 130 pays, comprenant cent mille collaborateurs. Nous intervenons sur toute la chaîne de l’énergie, de la production, jusqu’à la distribution en passant par la transformation. Il y a une multitude d’énergies :

Des énergies traditionnelles comme le gaz et le pétrole et des plus récentes comme l’éolien, le photovoltaïque (i.e. les énergies renouvelables).

Notre mission principale est d’animer les réseaux du CTG (Comité Technologie Groupe), au sein de Total c’est un ensemble de réseaux métiers techniques communs à toutes les branches du Groupe. Le CTG existe depuis plus de 20 ans et a toujours été le lieu pour les personnes des métiers de partager des compétences, des expériences, de mettre en œuvre des innovations et de les mettre en commun.

Pourquoi avez-vous mis en place une solution d’analyse sémantique NLP au sein du groupe ?

Nous avons deux objectifs principaux côté CTG :

  • Répondre à des enjeux de Knowledge Management, le CTG étant avant tout un espace de savoir, de synergie entre les outils et la technique.
  • Le 2e objectif est d’apporter des moyens de test et mise en oeuvre de nouvelles technologies (innovation) et de partage et développement de compétences nécessaires aux besoins du Groupe.

Afin de contribuer à nos enjeux KM, nous avons mis en place un thésaurus, le NLP permet d’enrichir celui-ci et en le combinant à nos outils facilite ainsi l’accès à la connaissance. Cela améliore également la qualité de notre moteur de recherche, la pertinence des mots de recherche et permet une navigation plus efficace entre tous les documents mis à disposition.

Concernant le 2e projet, « SIL » (Safety Integrate Level) : il est financé et piloté par le CTG, cela consiste à analyser des rapports de pannes sur des équipements de certains sites industriels pour en tirer un maximum de valeur. L’objectif du projet est de répondre à des enjeux de sécurité concernant plus particulièrement le site de Normandie (branche Raffinage Chimie). Il s’agit d’analyser des rapports rédigés par les opérateurs qui interviennent sur les équipements liés à l’instrumentation (équipements qui ont des fonctions de sécurité). Cela garantit que nos installations sont sécurisées.

Tout l’enjeu est de faire du NLP pour analyser tous ces mini-rapports non structurés, pour vérifier si ces équipements fonctionnent correctement. Cet enjeu est très important, sachant qu’auparavant l’exercice était fait à la main sur un tout petit échantillon de données.

Aujourd’hui nous avons analysé avec Proxem près de 400.000 verbatims (avis) liés à des rapports de panne ou de maintenance.

Les deux projets ont des objectifs assez distincts, tout en étant cohérent avec les missions du CTG.  Cependant ceux-ci sont liés car ils utilisent tous deux la partie du thésaurus consacrée aux phénomènes qui peuvent avoir un impact sur nos installations. Nous allons également retrouver le vocabulaire lié aux pannes utilisé sur SIL (par exemple, la corrosion).

Comme vous pouvez le constater, la solution d’analyse sémantique mise en place nous permet d’enrichir le vocabulaire, de le combiner à nos outils de recherche et ainsi de contribuer à l’amélioration de nos résultats.

En outre, nous souhaitons que ce vocabulaire soit accessible à l’ensemble du Groupe (groupe Total) qui travaille sur des cas d’usages NLP. En interne, nous essayons de faire la promotion de ces usages, à savoir l’utilisation des ressources sémantiques, afin que cela puisse être utilisé dans un maximum de contexte.

Aujourd’hui, nous allons publier ce vocabulaire dans un autre outil, afin que les Data Scientistes puissent compléter ce vocabulaire pour construire leur propre thésaurus.

Pour quelles raisons avez-vous retenu Proxem pour vos projets ?

Le projet « Thésaurus Vocabulaire » s’est déroulé il y a plus de deux ans après une construction manuelle de ce thésaurus.

Nous n’avions pas vu beaucoup d’autres solutions répondant à cet usage. L’intérêt majeur de l’outil est qu’il ne nécessite pas d’avoir un background très technique, par conséquent les équipes, notamment notre documentaliste à mi-temps, ont pu l’utiliser rapidement après une courte formation.

Pouvez-vous nous décrire les aboutissements qu’ont permis nos solutions ?

Nous avions 400 mots clés dans le thésaurus existant. Aujourd’hui avec Proxem, nous avons près de 6.000 concepts, ce qui est assez consistant. Cela joue un rôle important pour notre moteur de recherche pour améliorer tout ce qui est pertinence des résultats. Le vocabulaire a eu un impact mais il y a eu également d’autres développements associés pour améliorer la pertinence notamment.

L’objectif premier du projet SIL n’est pas le ROI mais la sécurité de nos installations. Grâce à l’ensemble de ces résultats nous avons été en mesure de calculer les taux de défaillance sur nos équipements. Nous avons des résultats assez cohérents par rapport à ce qui été évalué par le passé. Ces bons résultats nous permettent de valider cette méthode de manière officielle et ainsi d’espérer pouvoir l’automatiser et surtout d’approfondir son utilisation afin de donner encore plus de détails.

Quelles sont les perspectives d’évolution ?

Concernant le projet SIL, nous nous apercevons que ce cas d’usage va répondre à des objectifs essentiels quant à la sécurité, nous allons pouvoir l’appliquer pour adresser d’autres problématiques. Nous sommes en phase de recherche de valeur pour :

  • Prendre toutes les informations sur les pannes pour avoir plus de visibilité sur les coûts de maintenance.
  • Mettre en place des plans d’action pour vérifier la qualité des équipements et les rendre plus disponibles pour les étendre sur d’autres sites industriels.
  • Comparer les sites et faire émerger les bonnes pratiques d’un site à l’autre, et aller jusqu’à regarder les sous-catégories des équipements et fournisseurs, qui seraient meilleurs ou moins bons que les autres.
  • Revoir la stratégie d’achat des équipements ; nous souhaitons évaluer les coûts de maintenance.

Nous nous apercevons que ce que nous avons mis en place dans le cadre du SIL est intéressant dès lors qu’il va falloir évaluer la qualité d’un « asset » industriel.

Evaluer à grand échelle la qualité et la sureté de nos équipements, c’est l’objectif fixé.