Lavoisier et la data governance
La plupart d'entre nous connaissent Lavoisier (1743-1794) comme un grand scientifique, plus précisément un immense chimiste.
On lui attribue cette phrase, la maxime « Rien ne se perd, rien ne se crée, tout se transforme ». Bon a priori, c’est en fait la reformulation d’une phrase du philosophe grec Anaxagore : « Rien ne naît ni ne périt, mais des choses déjà existantes se combinent, puis se séparent de nouveau ». Un peu de culture générale 😊 !
Lavoisier a par contre bien découvert que si la matière change d'état au cours d'une réaction chimique, la quantité de matière reste la même au début et à la fin de l'expérience.
« Qu'est-ce que cela a à voir avec la gouvernance des données ? »
La relation est (presque) simple : les systèmes d’information ne font « que » transporter / transformer / présenter la donnée, c’est chimique…, ou informatique, au choix.
La donnée arrive par un point d’entrée, et finit quelque part… un peu vague, mais c’est vrai.
Donc, comme l’a fait Lavoisier, et plus tard le non moins fameux Mendeleïev, en matière de Chimie comme en matière d’information, pour contrôler un processus, il faudra le décomposer, comprendre ce qui s’y passe, le percer à jour.
C’est là que ça devient ardu… car pour un groupe multinational qui stocke de l’information depuis 40 ans, maintenant largement dans le Cloud, qui la processe avec d’innombrables outils, et qui l’expose avec au moins autant d’outils…, ambitionner d’avoir une Système d’Information parfaitement gouverné, c’est comme projeter de vider la mer à la petite cuillère !
Quelques exemples de grands chantiers que les équipes de data engineers ont à conduire. Vous vous y retrouverez peut-être. Liste non exhaustive.
Définir ce à quoi sert chacunes des informations, à qui,
Quelles sont les données obsolètes su système d’information,
Par quoi commencer pour rendre le SI le plus simple possible, le plus lisible,
Comment transformer son SI simplement et rapidement (migration technique d’outil à outil, migration Cloud),
Et puis, il y a toute la « compliance » (GDPR, BCBS239…etc), qui vient mettre un petit coup de pression aux équipes data à échéances régulières, en particulier dans les domaines financiers.
On y est ?
Pour agir, il y a la méthode papier crayon à grand renfort de consultants. Il y a fort à parier que le projet sitôt conduit pourra être jeté, comme le papier qui aura servi à le produire : un Système d’information, c’est vivant, la vérité d’hier n’est pas celle d’aujourd’hui, et encore moins celle d’après-demain !
Vous voulez devenir le crack de la data gouvernance, le Lavoisier des temps moderne qui saura tout décomposer/contrôler, suivez-moi !
1/ Il faut automatiser
Nous pensons qu’il faut nécessairement analyser un maximum de « stacks techniques » dans les Systèmes d’Information : le stockage de la donnée, son processing, son schedulling, son exposition dans la couche de data visualisation. Ainsi que tous les logs utiles.
Ce travail a priori pénible, redondant, qui demande de connaître tous les technologies présentes dans le Système d’Information, … il faudra le déléguer à des tiers : des sondes et des parsers, qui vont travailler dur, nuit et jour, sans jamais se tromper !
2/ Il faut connaître tous les chemins qu’emprunte la donnée
Ces analyses vont servir à définir le chemin qu’emprunte chaque donnée (« data lineage ») de sa source, à sa cible, on premise, dans le Cloud, et à l’intérieur même des outils de data visualisation… en traitant toutes les ruptures !
3/ Il faut savoir à quoi sert la donnée
Ce qui est important au-delà du chemin, c’est le but ! C’est un peu l’inverse de ce que dit Lao Tseu, mais pour le coup, un Système d’Information c’est un outil, pas un être sensible 😊.
C’est ça que les sondes et les parsers vont analyser aussi : ce à quoi servent réellement les innombrables données présentes dans un SI, i.e. leurs usages.
On se rendra vite compte qu’un SI est une usine à gaz qui pourrait être massivement simplifiée.
4/ Et il faut…tout imbriquer !
En croisant ces 2 approches, le « data lineage » et l’analyse des « usages », on arrive à une cartographie ultra granulaire, mais possiblement high level du SI, une sorte de Google Map de son système d’information, qui définit tous les chemins, mais aussi toutes les destinations.
Conclusion
On vous taxera certainement d’« alchimiste » si pour chaque donnée, vous êtes en capacité d’en donner l’origine, le devenir, les usages, si vous savez identifier les ruptures dans les chaîne d’alimentation pour intervenir, si vous savez identifier les « autoroutes de l’information », mais aussi toute la « matière morte » à évincer, etc.
Mais en réalité, l’alchimie, c’est précisément ce contre quoi Lavoisier s’est battu, pour faire triompher la science !
#datalineage #datagovernance
ellipsys@ellipsys-bi.com
www.ellipsys-bi.com
Commentaires
Enregistrer un commentaire