Champion français des cosmétiques, Clarins évolue vers une architecture Data Mesh

Clarins s'appuie sur un Data Lake et mise sur le Data Mesh

Clarins est une société familiale française spécialisée dans les cosmétiques qui fête ses 70 ans. Elle distribue ses produits de beauté à travers 150 pays et promeut les cosmétiques responsables. La marque est positionnée sur la beauté Prestige en Europe et emploie près de 8000 personnes dans le monde. La Data et le digital apparaissent clés pour accroître l’activité. Les équipes Data sont désormais organisées par domaines et s’appuient sur un Data Lake.

Recherche et développement en France et en Chine

La marque dispose d’une usine et d’un centre de recherches à Pontoise. Elle possède également un centre de recherche et de développement en Chine, à Shanghai, qui répond à la sensibilité et aux exigences de la clientèle en Asie.

Clarins souhaite recruter beaucoup plus de clients, en lien avec l’online et l’offline et accroître la notoriété de la marque

Clarins affiche des objectifs très forts sur ses départements digital et technologiques incluant la data. Le premier, c’est de recruter beaucoup plus de clients, d’être en lien avec l’online et l’offline et d’accroître la notoriété de la marque à travers des expériences mémorables. La démarche vise à stimuler et accélérer les ventes en ligne. Le deuxième objectif vise à s’appuyer sur ses clients et les convertir en ambassadeurs de la marque.


Le but est développer la relation avec le client, même en dehors de la démarche de l’achat. Autre enjeu, il s’agit de stimuler la performance opérationnelle à travers toute l’entreprise grâce aux bons outils aux process internes. Enfin, en quatrième objectif, l’entreprise veut devenir « data driven », axée sur la data. L’équipe Data est chargée d’accélérer cette accessibilité à la data à travers tous les départements de l’entreprise et de faciliter l’accès  à cette donnée pour tous les collaborateurs.

Une gouvernance des données sur quatre piliers



Au vu de ces objectifs, il a été nécessaire pour Clarins de déployer une gouvernance data ad hoc. Cette gouvernance data qui est souvent vécue comme une charge dans beaucoup d’entreprises a été déployée sur quatre axes : l’accessibilité, la standardisation, la qualité de la donnée et la propriété de la donnée (« ownership« ) qui définit les rôles et les responsabilités des personnes qui traitent la data.

Clarins a défini des rôles et des responsabilités, des « Data owners » (propriétaires des données) et des « Business Data experts » (experts de la donnée métier)

Afin de mettre en place cette gouvernance, l’entreprise a procédé à la cartographie du domaine Data. Sur les domaines Data, Clarins a défini des rôles et des responsabilités, donc des « Data owners » (propriétaires des données) et des « Business Data experts » (experts de la donnée métier).  Les règles de qualité des données ont également été définies ainsi que les domaines Data. Le recours au Data Mesh est alors apparu évident au travers du Data Lake mis en place sur une solution proposée par l’éditeur Snowflake.

Chez Clarins, le Data Mesh est le fait d’organiser toute l’équipe Data par domaines fonctionnels. C’est une nouvelle approche. Auparavant, l’équipe Data était organisée en équipe centralisée pour ce qui concerne la partie de la visualisation des données. Cette équipe était placée en interface (« front ») auprès des métiers de Clarins. Elle orientait les besoins Data et de visualisation des données vers l’équipe en charge de la plateforme Data et les ingénieurs Data.


Le Data Mesh doit servir à éviter les goulets d’étranglement

Mais même en mode « sprint », cette approche créait des goulets d’étranglement. Il y avait trop de projets de Business Intelligence insuffisamment qualifiés et priorisés. Le « time to delivery » n’était ni efficace ni performant. Le Data Mesh a permis d’organiser des équipes par métiers avec les domaines Finance, Supply, Digital, CRM, Marché gris, Sell-out, R&D et Training. Les besoins des métiers sont identifiés, organisés et validés par domaine.

Une équipe transverse assure la cohérence du développement sur tous les produits de données

Une équipe a alors la propriété (« ownership ») de toute la donnée de bout en bout, depuis le système source jusqu’à la consommation en data visualisation avec des compétences de Data Product Owner, de Data Engineers, de développeurs BI, de BPO, d’utilisateurs métiers, d’IT custodian, etc. D’autre part, une équipe transverse assure la cohérence du développement sur tous les produits de données (« Data products ») au sein des différentes équipes (« squads ») des domaines Data.


La qualité des données est aidée par la plateforme Snowflake. Celle-ci sert à déployer des pipelines de contrôle de données avec des logs et avec des remontées d’alerte. Clarins ne dispose pas pour le moment de catalogue des données. L’entreprise est en train d’éprouver les usages de ses Business Data experts sur des fichiers Excel pour s’assurer du bon choix d’un outil de « Data Catalog ».

Renseignement des méta données dans la plateforme Snowflake

Les équipes Data documentent énormément les métadonnées de Snowflake. Plus les données sont placées dans le Data Lake Snowflake, plus l’équipe Data place des commentaires en métadonnées, en tag sur Snowflake, afin de pouvoir présenter ces données dans les « Data catalogues ».

Côté visualisation des données, Clarins s’appuie sur les outils Qlik et Cognos

La communication entre les équipes est alors nécessaire afin de promouvoir en interne cette gouvernance de la donnée et s’assurer que les « squads » (équipes) déploient bien cette gouvernance de la data. Côté visualisation des données, Clarins s’appuie sur les outils Qlik et Cognos. Quant aux pipe lines d’ingestion des données, ils sont gérés par un outillage Microsoft et Snowflake.

Sur ADLS (Azure Data Lake Storage), Clarins a standardisé le mode d’ingestion des fichiers des différentes data spécifiques dans son Data Lake. Dans cette architecture, Microsoft joue alors la complémentarité avec Snowflake. Les données brutes sont traitées par ADSL de Microsoft et par Databricks, autre concurrent de Snowflake. D’autre part, en matière de modélisation, Clarins est en train de déployer ses « Data products ». 

Absence de Data Mesh de bout en bout sur le Data Lake

« Nous ne sommes pas encore organisés en Data Mesh de bout en bout sur le Data Lake. Nous sommes en en train de définir nos ‘data products’ par stream fonctionnel. C’est en cours » explique-t-on côté équipes Data de Clarins. Le suivi financier de ces plateformes, leur administration ainsi que la sécurisation sont renseignés par Microsoft et Snowflake. 

« Nous sommes en train de  consolider les suivis de consommation sur un outil de reporting central »

« Nous sommes en train de  consolider les suivis de consommation sur un outil de reporting central. On récupère toutes ces données des deux plateformes » poursuit-on chez Clarins.

Ces frameworks (cadres de développement) sont promus au sein de l’équipe Data transverse pour que toutes les squads déploient aussi ces mêmes packages pour assurer une cohérence de développement. Clarins utilise ADF (Azure Data Factory) de Microsoft en ce qui concerne la partie orchestration et pipeline simple dans son Data Lake. Côté visualisation des données, outre Qlik et Cognos pour l’opérationnel, Clarins emploie Tableau pour les Data Analysts.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *