Mais où sont passés les Data Stewards ?

26 Septembre 2018
Data stewards
Les data steward un nouveau métier qui émerge depuis 3 ans désormais. Découvrez cette nouvelle fonction présente dans de multiples secteurs d'activité, par Pierre-Sylvain ROOS Chief Technical Marketing Officer.

Un nouveau metier ?

Ça a commencé il y a un peu moins de trois ans maintenant, pour la première fois en France des clients cherchaient des consultants « Data Steward ». Depuis, les demandes en service de « Data Stewardship » n’ont cessé de s’amplifier. Elles sont désormais récurrentes et concernent de plus en plus de secteurs d’activités. 

Bien évidemment, au départ il a fallu investiguer pour comprendre ce qui se cachait derrière ce terme de Data Steward qui résonne un peu étrangement. Pour tout un chacun, un steward est une personne en charge de l’accueil et du service auprès des voyageurs dans un avion. Pourquoi des données auraient-elles besoin d’un steward ?

Un premier élément de réponse : c’est parce que les données il y en a de plus en plus, et que le volume de données produites dans le monde est en croissance exponentielle et ininterrompue.

Deuxième élément : c’est que ces données produites en masse, ces Big Data, les entreprises s’attellent désormais à les utiliser et à les valoriser. Pour cela, il faut savoir quelles données utiliser à quel moment ou dans quel contexte. Et donc toutes ces données il faut en maîtriser le cycle de vie, la qualité et le sens.

C’est pour ces raisons que depuis le début des années 2000, des grandes entreprises ont commencé à mettre en place des dispositions spécifiques pour structurer et améliorer la gestion et la sécurisation de leurs données.  

En particulier, les grandes banques internationales ont été aux avant-postes dans le développement de la gouvernance des données (Data Governance), avec une accélération notable à partir de 2013 sous l’effet de l’entrée en vigueur du standard BCBS 239 - «Principles for effective risk data aggregation and risk reporting » dans le cadre des règlementations Bâle III.

Quant au Data Steward, c’est sur l’impulsion du Data Governance Institute (fondé en 2003) que son rôle et ses fonctions émergent progressivement, pour en faire l’acteur incontournable d’une organisation de Data Governance mature. Car le Data Steward c’est celui qui prend soin des actifs de Data, c’est un métier à part entière qui est entièrement défini, structuré et décrit depuis 2014.

Et en France ? Eh bien, en parcourant récemment un ouvrage des Editions de l’Etudiant consacré aux métiers de la Data, je n’ai pu que constater l’absence complète du Data Steward, nulle trace nulle part, pas une ligne, pas une mention.

Idem si l’on veut trouver un « Data Steward » en titre à la recherche d’un emploi, le moins que l’on puisse dire c’est que les candidats sont rares ! 

Il faut bien se rendre à l’évidence, en France le métier de Data Steward est encore quasiment inconnu, et encore moins reconnu … A moins que ce ne soit l’appellation en elle-même, car il est fort probable aussi qu’un certain nombre de spécialistes de la Data soient des Data Stewards sans le savoir.  D’ailleurs, en cherchant un peu on trouve des terminologies qui peuvent correspondre à cela : gardien des données, intendant des données, dépositaire des données, coordinateur des données ou encore administrateur des données.   

Alors pour trouver des Data Stewards, le mieux est de se focaliser sur la fonction et le rôle exercés plutôt que sur le titre, et de rentrer un minimum dans la compréhension du « Data Stewardship ».    

 

Il y a plusieurs types de Data Steward

C’est la première surprise lorsque l’on se penche un peu plus sur ce métier. Il n’y a pas « un » mais « des » Data Stewards avec des rôles et des fonctions complémentaires et plus ou moins raffinés suivant l’importance et la maturité de l’organisation de Data Governance en place. Il y a même un Chief Data Stewards dans certains cas (qui peut aussi avoir le titre de Data Governance Manager).

Ce sont eux qui mettent en œuvre la partie opérationnelle de la gouvernance des données et qui réalisent le travail nécessaire au jour le jour en assurant que les données soient disponibles pour toute l’entreprise. 

A peu près toutes les sources convergent pour retenir 5 ou 6 types de Data Stewards, les voici :

  • Entreprise Data Steward : il agit en transverse pour toute l’entreprise, généralement c’est lui qui coordonne les Business Data Stewards ;
  • Business Data Steward : il a en charge les données relatives à l’un des métiers de l’entreprise, avec en particulier la gestion du cycle de vie des données, la gestion de la qualité des données. Il facilite et permet la bonne compréhension et la maîtrise des données par le métier ;
  • Domain Data Steward : idem que le Business Data Steward mais il a un rôle plus spécifique puisqu’il s’occupe uniquement de données qui sont partagées par plusieurs métiers, avec des prérogatives d’arbitrage et de coordination ; 
  • Project Data Steward : il intervient pour un ou des projets en assurant un alignement entre les données utilisées et les besoins du projet ;
  • Technical Data Steward : il fournit l’expertise technique sur les systèmes permettant de produire, de transformer ou de stocker les données ; 
  • Operational Data Steward : il assiste en particulier les Business Data Steward et intervient directement sur les données. Il s’assure que les opérations menées sur les données sont valides et effectives.

Tous ces Data Stewards travaillent ensemble sous l’autorité d’un Data Governance Program Office (DGPO), et l’entité spécialement en charge des Data Stewards au sein du DGPO s’appelle le Data Stewardship Council.

Bien évidemment, suivant les choix d’organisation et la maturité de la gouvernance des données, l’accent sera plus ou moins mis sur certains aspects de Data Stewardship. Et pour l’instant, on ne trouvera pas, a priori, tous ces types de Data Stewards dans une même organisation. 

 

Un objectif primordial : Améliorer la qualité des données

Le Data Stewardship est une évolution des métiers de la Qualité des Données. 

Le Data Steward s’intéresse non seulement à la qualité intrinsèque des données, mais aussi à leur sémantique et à leur utilisation.

Donc il aura à gérer des aspects qualitatifs classiques comme le format des données, leur validité technique, leur complétude ou leur intégrité et leur unicité.

Et puis il devra s’assurer des conditions dans lesquelles les données peuvent être utilisées, établir et documenter des règles d’usage et faire en sorte que les données aient du sens, soient précises et n’introduisent pas de biais lorsqu’on les analyse.

A titre d’illustration, voici trois cas typiques de ce que le Data Steward aura à résoudre (avec un exemple simple pour chaque) :

  • Des données ne sont pas exploitables parce que leur source n’est pas fiable : c’est ce qui se passe avec l’heure et la date interne des smartphones. L’origine la plus incidente de ce problème bien connu, c’est le succès du jeu Candy Crush Saga. En effet, pour gagner des vies supplémentaires sans attendre et sans payer, les joueurs les plus accros (c’est-à-dire quasiment tous) n’hésitent pas à avancer l’heure ou la date de l’horloge interne de leur appareil. Et Candy Crush Saga compte plus de 380 millions de joueurs actifs, soit environ 16% des utilisateurs de smartphones dans le monde. Il faut donc s’appuyer sur une horloge externe pour horodater un évènement provenant d’un smartphone ;
  • Certaines données ont une validité limitée dans le temps : la taille d’un enfant ou d’un adolescent évolue fortement, voire très fortement, jusqu’à ce qu’il ait atteint sa taille adulte. Pour avoir du sens, cette donnée doit être systématiquement associée à une date. 
  • Des données sont correctes dans leur forme mais ne sont pas vraisemblables : si une date de délivrance de médicaments (dans une pharmacie) est antérieure à la date d’établissement de l’ordonnance, c’est qu’au moins l’une des deux dates est erronée. Les deux dates doivent être vérifiées et corrigées.

Dans chaque situation c’est au Data Steward qu’il incombe de fixer les conditions et les limites d’utilisation des données et de négocier leurs choix de gestion avec les parties prenantes.

En plus de cela, l’une de ses préoccupations importantes est aussi d’éviter que la qualité de Data ne se détériore. Pour s’en assurer il doit mettre en place des métriques et effectuer un monitoring en continu.

Enfin, pas de données sans métadonnées non plus. Les métadonnées servent à définir et à décrire les données, et le Data Steward s’y intéresse tout spécialement. Ce sont elles qui vont lui permettre de gérer et de qualifier les données d’une part, et ensuite elles constituent par elles-mêmes une source précieuse d’analyse et d’information.  

Dans tous les cas, le rôle majeur du Data Steward est de détecter pro-activement tous les problèmes de qualité des données, et ce le plus en amont possible avant même que les utilisateurs des données ne soient impactés. Aussi il intervient souvent directement auprès des producteurs des données et s’assure que les problèmes détectés sont effectivement corrigés.

Le bénéfice le plus manifeste de la mise en place du Data Stewardship est l’amélioration visible et continue de la qualité des données. 

 

Les outils du Data Steward

Une organisation de Data Governance mature est une organisation outillée. Et l’efficacité du Data Steward est absolument dépendante de l’efficacité et de la performance des outils dont il dispose. C’est d’ailleurs le marqueur le plus repérable pour qualifier le niveau de développement du Data Stewardship dans une entreprise.

Ainsi, il y a quatre outils clés qui sont particulièrement importants pour le Data Steward :

  • le portail de Data Stewardship : c’est un outil de communication permettant d’exposer les travaux accomplis par les Data Stewards et de diffuser leurs résultats auprès des acteurs de l’entreprise qui en ont besoin (politiques de gestion, procédures, contacts, etc.) ;   
  • le Wiki de Data Stewardship : c’est la base de capitalisation des termes spécialisés, des méthodes et des meilleures pratiques des Data Stewards ; 
  • le glossaire métier : il contient les nomenclatures des données, la ou les définitions des termes métier, leurs règles d’usage et de validation, qui en est propriétaire et leur classification de sécurité, ainsi que les exigences de qualité rattachées ;
  • le référentiel des métadonnées : c’est le système qui référencie et décrit toutes les métadonnées physiques (log, horodatage, taille, etc.) ou techniques (structure de fichier, format d’interface, etc.) avec leurs liens.

Et pour le fonctionnement des activités, il faut y ajouter un système de ticketing permettant de saisir, de documenter et d’adresser les problèmes liés aux données.
 

On n’est pas Data Steward, on le devient …

Vous l’aurez compris, la route est encore longue avant que l’on puisse trouver des Data Stewards dans toutes les entreprises. A ce jour les organisations de Data Governance les plus avancées sont elles-mêmes en pleine transformation. Sont concernées des grandes banques, des compagnies d’assurances et depuis peu des opérateurs telecoms ou des distributeurs d’énergie.

Ce développement de la Data Governance, et du métier de Data Steward qui va avec, est bien souvent concomitant avec le développement et l’industrialisation des activités de Big Data. Toutes ces entreprises s’orientent vers un modèle d’activités Data Driven où la Data devient l’actif principal et le centre des préoccupations.

C’est pourquoi il est intéressant de noter qu’il existe un modèle de maturité du Data Stewardship, et que ce modèle constitue un outils d’accompagnement particulièrement indicatif et efficace pour guider et orienter toutes ces entreprises dans leur démarche de déploiement et de structuration de la Data Governance.

Ce modèle repose sur quatre piliers (ou quatre questions clés) :

  • est-ce que mon organisation a bien intégré le Data Stewardship et comment est-ce qu’elle le sponsorise ?
  • est-ce que le rôle des Data Stewards est bien défini et comment leurs activités sont-elles structurées ?
  • est-ce que le Data Stewardship s’appuie sur des standards, des politiques et des processus bien formalisés et déployés ? 
  • est-ce que l’organisation est capable de mesurer et de prouver la valeur créée par le Data Stewardship ?

Le niveau de réponse pour chacun de ces axes de développement permet de figurer le chemin restant à faire et de se projeter par étapes.

Et effectivement, si l’on revient trois ans en arrière, la plupart des entreprises qui s’étaient engagées dans la Data Governance en France n’avaient pas encore très bien identifié ni formalisé le rôle du Data Steward. C’est désormais chose faite et le déploiement récent de la RGPD (Règlement Général sur la protection des données) va constituer un levier supplémentaire pour la montée en puissance du Data Stewardship.

Reste pour bon nombre des actuels spécialistes de la Data, quelle que soit leur appellation, à passer le cap et à évoluer vers une fonction de Data Steward reconnue et valorisée. Nul doute que ce mouvement est d’ores et déjà enclenché.

Alors pour conclure, et pour revenir sur l’interrogation initiale de cet article, si vous vous posez encore la question, ou si on vous demande où sont les Data Stewards, la réponse est finalement assez simple : Ils arrivent !  

N'hésitez pas à visiter nos pages web dédiées au Digital et Transformation Numérique et au Big Data.
 

Parlons ensemble de vos projets

bouton contact