Le data lineage, l’arme idéale pour la Data Loss Prevention ?

 

Le data lineage technique couplé à la détection des usages de l’information permet de savoir au départ de n’importe quelle donnée, qui y accède finalement, et dans quel contexte.



Et si c’était un grand pas vers une véritable sécurité informationnelle, une réponse simple et efficace pour la Data Leaks/Loss Prevention ? 


La DLP (Data Leaks / Loss Prevention), c’est quoi ?  

_______________________________________

« Le terme Data Loss/Leaks Prevention (DLP) fait référence à un ensemble de techniques qui permettent d’identifier, de contrôler et de protéger l’information grâce à des analyses de contenu approfondies, que l’information soit stockée, en mouvement, ou traitée. L’objectif est de limiter la fuite de données sensibles. 

Une solution DLP est capable d’identifier les données sensibles, de repérer l’endroit où elle est stockée, de contrôler qui doit avoir accès à ces données et enfin de les protéger, c’est-à-dire d’empêcher toute personne non autorisée à y avoir accès… » Wikipédia

C'est une composante majeure du monde de la Cybersécurité 

 

Les composantes majeures d’une solution de DLP

_______________________________________

Les solutions de DLP sont disparates et n’apportent généralement pas les mêmes réponses. Néanmoins, elles ont souvent un socle commun qui reprend les 3 fonctionnalités suivantes :

  • Une gestion des périphériques de sorties, par exemple le blocage des clefs USB, etc.
  • Une composante relative aux contenus, en empêchant la copie des certaines données vers certains composants.  
  • Une composante relative aux règles : il s’agit de contrainte au niveau de l’impression, de l’envoi d’informations par email, etc.

 

Les limites des solutions de DLP

_______________________________________

Les entreprises dépensent des milliards en DLP ! 

Selon CrowdStrike, les dépenses devraient atteindre plus de 6 milliards de dollars d'ici 2026. 

Malheureusement, de nombreuses entreprises ne voient pas le retour sur investissement qu'elles attendent : les solutions DLP ont acquis la réputation d'être trop difficiles à mettre en œuvre et à maintenir, et elles n’offrent pas la pertinence adéquate pour la totalité des stacks technologiques concernés.  Elles ont également acquis la réputation de déclencher de fausses alertes, un comble !

 

Sans se substituer aux solutions de Data Leaks Prevention, le data lineage associé à l’analyse des usages de l’information permettra de sécuriser la donnée sensible pour ce qui concerne ses déploiements dans le Système d’Information. 

Le data lineage permettra aussi de savoir qui y accède, tout en répondant à un grand nombre d’autres problématiques.

 

... Mais qu’est que le « data lineage » ?

_______________________________________

Le data lineage révèle le cycle de vie des données. 

Il vise à présenter des flux de données complets, des sources à l’exploitation de la donnée par les métiers. Cela inclut toutes les transformations subies par les données jusqu’à leurs usages.

Par la combinaison des différents flux de données, le data lineage permet d’établir une véritable cartographie du Système d’Information. Cette cartographie peut être partagée à tous.




Le data lineage dans le contexte DLP / Cybersécurité

_______________________________________

Dans un contexte DLP, un data lineage dynamique est combiné avec l’analyse des usages des données (via un scan des logs), pour savoir instantanément qui accède à telle ou telle donnée. Ce peut être un accès via des outils de dataviz, ou même via une simple requête pour alimenter un fichier Excel.

Les équipes compliance peuvent ainsi au départ de la simple saisie d’un nom de donnée dans un moteur de recherche, connaître les usages qui en auront été faits, et ainsi mettre le doigt sur de potentiels usages non conformes aux règles internes ! 

Les analyses du Système d’Information ayant lieu quotidiennement, les réponses délivrées seront toujours le reflet de la réalité. Et il est possible de paramétrer des alertes, par mail par exemple. Il ne reste qu’à agir ! 

 


Différentes vues du data lineage de {openAudit}

 

Le data lineage a un impact vertueux dans d’autres contextes

_______________________________________

Le data lineage est un composant technique des outils de la Data Governance, ou du Metadata Management. Il permet d’adresser d’innombrables use cases dont voici quelques exemples :

  • Dépendance stratégique aux données : de bonnes données assurent le bon fonctionnement des entreprises. Toutes les business units, y compris le marketing, la production, le contrôle de gestion, les départements ventes, etc., dépendent des données. Les informations recueillies à partir de recherches, du terrain, des systèmes opérationnels, permettent d'optimiser les organisations et d'améliorer les produits et services. Les informations granulaires fournies par le data lineage aident à mieux comprendre la signification réelle de ces données, et permettent d’en valider la qualité.

  • Des flux de données à jour : les données changent au fil du temps, de nouvelles méthodes de collecte et d'agglomération de données doivent être combinées, et utilisées par les équipes pour créer de la valeur business. Le data lineage fournit des fonctionnalités de suivi qui permettent de réconcilier ces flux, et de tirer le meilleur parti des anciens et des nouveaux sets de données, dans le Cloud ou on Premise.

  • Migrations de données : lorsque le service IT doit migrer des données vers de nouvelles solution de storage, typiquement le Cloud, ou encore opérer des migrations techniques de logiciel à logiciel, il doit être capable de cartographier et de définir le cycle de vie des données dans son système en source. Le data lineage fournit ces informations efficacement, ce qui rend les projets de migration infiniment plus simple et moins risqués. En outre le data lineage permet de hiérarchiser et de ségréger les flux, pour organiser précisément les migrations.

  • Gouvernance des données : le data lineage est un bon moyen de fournir des gages en cas d’audit de conformité, d'améliorer la gestion des risques et de garantir que les données sont stockées et traitées conformément aux politiques organisationnelles et aux exigences réglementaires. Les plus connues étant le texte BCBS239, le volet data de Bâle III qui ambitionne de consolider le reporting de risque dans le monde bancaire, ainsi que tous les flux d’alimentation sous-jacents. Le second, bien plus connu, étant le GDPR, le règlement européen qui ambitionne de redonner aux particuliers un contrôle sur leurs données personnelles. Le data lineage permettra d’éviter une diffusion anarchique des données dites "personnelles". 

Conclusion

_______________________________________

Le data lineage devient un outil indispensable pour partager la gouvernance des systèmes d’information importants et complexes.

Pour travailler sur la Data Loss/Leaks Prevention qui est un élément clef de la cybersécurité, ce sera un allié précieux, car simple, efficace, perpétuellement à jour, et bon marché par rapport à l'essentiel des solutions de DLP ! De nombreux autres sujets pourront être traités par ailleurs. 

 








www.ellipsys-bi.com 
ellipsys@ellipsys-bi.com


 

Commentaires

Posts les plus consultés de ce blog

La Data Observabilité, Buzzword ou nécessité ?

Migrer de SAP BO vers Power BI, Automatiquement, Au forfait !

BCBS 239 : L'enjeu de la fréquence et de l'exactitude du reporting de risque