Le data lineage, l’arme idéale pour la Data Loss Prevention ?
Le data lineage technique couplé à la détection des usages de l’information permet de savoir au départ de n’importe quelle donnée, qui y accède finalement, et dans quel contexte.
Et si c’était un grand pas vers une véritable sécurité informationnelle, une réponse simple et efficace pour la Data Leaks/Loss Prevention ?
La DLP (Data Leaks / Loss Prevention), c’est quoi ?
_______________________________________
« Le terme Data Loss/Leaks
Prevention (DLP) fait référence à un ensemble de techniques qui permettent
d’identifier, de contrôler et de protéger l’information grâce à des analyses de
contenu approfondies, que l’information soit stockée, en mouvement, ou traitée. L’objectif est de
limiter la fuite de données sensibles.
Une solution DLP est capable
d’identifier les données sensibles, de repérer l’endroit où elle est
stockée, de contrôler qui doit avoir accès à ces données et enfin de les
protéger, c’est-à-dire d’empêcher toute personne non autorisée à y avoir accès… » Wikipédia
C'est une composante majeure du monde de la Cybersécurité
Les composantes majeures d’une solution de DLP
_______________________________________
Les solutions de DLP sont disparates et n’apportent généralement pas les mêmes réponses. Néanmoins, elles ont souvent un socle commun qui reprend les 3 fonctionnalités suivantes :
- Une gestion des périphériques de sorties, par exemple le blocage des clefs USB, etc.
- Une composante relative aux contenus, en empêchant la copie des certaines données vers certains composants.
- Une composante relative aux règles : il s’agit de contrainte au niveau de l’impression, de l’envoi d’informations par email, etc.
Les limites des solutions de
DLP
_______________________________________
Les entreprises dépensent des milliards en DLP !
Selon CrowdStrike, les dépenses devraient atteindre plus de 6 milliards de dollars d'ici 2026.
Malheureusement, de nombreuses entreprises ne voient pas le retour sur
investissement qu'elles attendent : les solutions DLP ont acquis la
réputation d'être trop difficiles à mettre en œuvre et à maintenir, et elles n’offrent
pas la pertinence adéquate pour la totalité des stacks technologiques concernés.
Elles ont également acquis la réputation
de déclencher de fausses alertes, un comble !
Sans se substituer aux solutions de Data Leaks Prevention, le data lineage associé à l’analyse des usages de l’information permettra de sécuriser la donnée sensible pour ce qui concerne ses déploiements dans le Système d’Information.
Le data lineage permettra aussi de savoir qui y accède, tout en répondant à un grand
nombre d’autres problématiques.
... Mais qu’est que le « data lineage » ?
Le data lineage révèle le cycle de vie des données.
Il
vise à présenter des flux de données complets, des sources à l’exploitation de
la donnée par les métiers. Cela inclut toutes les transformations subies par
les données jusqu’à leurs usages.
Par la combinaison des différents flux de données, le data lineage permet d’établir une véritable cartographie du Système d’Information. Cette cartographie peut être partagée à tous.
Le data lineage dans le contexte DLP / Cybersécurité
_______________________________________
Dans un contexte DLP, un data lineage dynamique est combiné avec l’analyse des usages des données (via un scan des logs), pour savoir instantanément qui accède à telle ou telle donnée. Ce peut être un accès via des outils de dataviz, ou même via une simple requête pour alimenter un fichier Excel.
Les équipes compliance peuvent ainsi au départ de la simple saisie d’un nom de donnée dans un moteur de recherche, connaître les usages qui en auront été faits, et ainsi mettre le doigt sur de potentiels usages non conformes aux règles internes !
Les analyses du Système d’Information ayant lieu quotidiennement, les réponses délivrées seront toujours le reflet de la réalité. Et il est possible de paramétrer des alertes, par mail par exemple. Il ne reste qu’à agir !
Différentes vues du data lineage de {openAudit}
Le data lineage a un impact vertueux dans d’autres
contextes
Le data lineage est un composant technique des outils de la Data Governance,
ou du Metadata Management. Il permet d’adresser d’innombrables use cases dont
voici quelques exemples :
- Dépendance stratégique aux données : de bonnes données assurent le bon fonctionnement des entreprises. Toutes les business units, y compris le marketing, la production, le contrôle de gestion, les départements ventes, etc., dépendent des données. Les informations recueillies à partir de recherches, du terrain, des systèmes opérationnels, permettent d'optimiser les organisations et d'améliorer les produits et services. Les informations granulaires fournies par le data lineage aident à mieux comprendre la signification réelle de ces données, et permettent d’en valider la qualité.
- Des flux de données à jour : les données changent au fil du temps, de nouvelles méthodes de collecte et d'agglomération de données doivent être combinées, et utilisées par les équipes pour créer de la valeur business. Le data lineage fournit des fonctionnalités de suivi qui permettent de réconcilier ces flux, et de tirer le meilleur parti des anciens et des nouveaux sets de données, dans le Cloud ou on Premise.
- Migrations de données : lorsque le service IT doit migrer des données vers de nouvelles solution de storage, typiquement le Cloud, ou encore opérer des migrations techniques de logiciel à logiciel, il doit être capable de cartographier et de définir le cycle de vie des données dans son système en source. Le data lineage fournit ces informations efficacement, ce qui rend les projets de migration infiniment plus simple et moins risqués. En outre le data lineage permet de hiérarchiser et de ségréger les flux, pour organiser précisément les migrations.
- Gouvernance des données : le data lineage est un bon moyen de fournir des gages en cas d’audit de conformité, d'améliorer la gestion des risques et de garantir que les données sont stockées et traitées conformément aux politiques organisationnelles et aux exigences réglementaires. Les plus connues étant le texte BCBS239, le volet data de Bâle III qui ambitionne de consolider le reporting de risque dans le monde bancaire, ainsi que tous les flux d’alimentation sous-jacents. Le second, bien plus connu, étant le GDPR, le règlement européen qui ambitionne de redonner aux particuliers un contrôle sur leurs données personnelles. Le data lineage permettra d’éviter une diffusion anarchique des données dites "personnelles".
Conclusion
Le data lineage devient un outil
indispensable pour partager la gouvernance des systèmes d’information
importants et complexes.
Pour travailler sur la Data Loss/Leaks Prevention qui est un élément clef de la cybersécurité, ce sera un allié
précieux, car simple, efficace, perpétuellement à jour, et bon marché par
rapport à l'essentiel des solutions de DLP ! De nombreux autres sujets pourront être traités par ailleurs.
Commentaires
Enregistrer un commentaire