Clarins est une société familiale française spécialisée dans les cosmétiques qui fête ses 70 ans. Elle distribue ses produits de beauté à travers 150 pays et promeut les cosmétiques responsables. La marque est positionnée sur la beauté Prestige en Europe et emploie près de 8000 personnes dans le monde. La Data et le digital apparaissent clés pour accroître l’activité. Les équipes Data sont désormais organisées par domaines et s’appuient sur un Data Lake.
Recherche et développement en France et en Chine
La marque dispose d’une usine et d’un centre de recherches à Pontoise. Elle possède également un centre de recherche et de développement en Chine, à Shanghai, qui répond à la sensibilité et aux exigences de la clientèle en Asie.
Clarins souhaite recruter beaucoup plus de clients, en lien avec l’online et l’offline et accroître la notoriété de la marque
Le but est développer la relation avec le client, même en dehors de la démarche de l’achat. Autre enjeu, il s’agit de stimuler la performance opérationnelle à travers toute l’entreprise grâce aux bons outils aux process internes. Enfin, en quatrième objectif, l’entreprise veut devenir « data driven », axée sur la data. L’équipe Data est chargée d’accélérer cette accessibilité à la data à travers tous les départements de l’entreprise et de faciliter l’accès à cette donnée pour tous les collaborateurs.
Une gouvernance des données sur quatre piliers
Au vu de ces objectifs, il a été nécessaire pour Clarins de déployer une gouvernance data ad hoc. Cette gouvernance data qui est souvent vécue comme une charge dans beaucoup d’entreprises a été déployée sur quatre axes : l’accessibilité, la standardisation, la qualité de la donnée et la propriété de la donnée (« ownership« ) qui définit les rôles et les responsabilités des personnes qui traitent la data.
Clarins a défini des rôles et des responsabilités, des « Data owners » (propriétaires des données) et des « Business Data experts » (experts de la donnée métier)
Chez Clarins, le Data Mesh est le fait d’organiser toute l’équipe Data par domaines fonctionnels. C’est une nouvelle approche. Auparavant, l’équipe Data était organisée en équipe centralisée pour ce qui concerne la partie de la visualisation des données. Cette équipe était placée en interface (« front ») auprès des métiers de Clarins. Elle orientait les besoins Data et de visualisation des données vers l’équipe en charge de la plateforme Data et les ingénieurs Data.
Le Data Mesh doit servir à éviter les goulets d’étranglement
Mais même en mode « sprint », cette approche créait des goulets d’étranglement. Il y avait trop de projets de Business Intelligence insuffisamment qualifiés et priorisés. Le « time to delivery » n’était ni efficace ni performant. Le Data Mesh a permis d’organiser des équipes par métiers avec les domaines Finance, Supply, Digital, CRM, Marché gris, Sell-out, R&D et Training. Les besoins des métiers sont identifiés, organisés et validés par domaine.
Une équipe transverse assure la cohérence du développement sur tous les produits de données
La qualité des données est aidée par la plateforme Snowflake. Celle-ci sert à déployer des pipelines de contrôle de données avec des logs et avec des remontées d’alerte. Clarins ne dispose pas pour le moment de catalogue des données. L’entreprise est en train d’éprouver les usages de ses Business Data experts sur des fichiers Excel pour s’assurer du bon choix d’un outil de « Data Catalog ».
Renseignement des méta données dans la plateforme Snowflake
Les équipes Data documentent énormément les métadonnées de Snowflake. Plus les données sont placées dans le Data Lake Snowflake, plus l’équipe Data place des commentaires en métadonnées, en tag sur Snowflake, afin de pouvoir présenter ces données dans les « Data catalogues ».
Côté visualisation des données, Clarins s’appuie sur les outils Qlik et Cognos
Sur ADLS (Azure Data Lake Storage), Clarins a standardisé le mode d’ingestion des fichiers des différentes data spécifiques dans son Data Lake. Dans cette architecture, Microsoft joue alors la complémentarité avec Snowflake. Les données brutes sont traitées par ADSL de Microsoft et par Databricks, autre concurrent de Snowflake. D’autre part, en matière de modélisation, Clarins est en train de déployer ses « Data products ».
Absence de Data Mesh de bout en bout sur le Data Lake
« Nous ne sommes pas encore organisés en Data Mesh de bout en bout sur le Data Lake. Nous sommes en en train de définir nos ‘data products’ par stream fonctionnel. C’est en cours » explique-t-on côté équipes Data de Clarins. Le suivi financier de ces plateformes, leur administration ainsi que la sécurisation sont renseignés par Microsoft et Snowflake.
« Nous sommes en train de consolider les suivis de consommation sur un outil de reporting central »
Ces frameworks (cadres de développement) sont promus au sein de l’équipe Data transverse pour que toutes les squads déploient aussi ces mêmes packages pour assurer une cohérence de développement. Clarins utilise ADF (Azure Data Factory) de Microsoft en ce qui concerne la partie orchestration et pipeline simple dans son Data Lake. Côté visualisation des données, outre Qlik et Cognos pour l’opérationnel, Clarins emploie Tableau pour les Data Analysts.