La force et les limites du SQL ?






Le SQL et ses nombreux dialectes                                                                   

Il existe de nombreux système de bases de données qui reposent sur le SQL. 

Pour ne citer que les connus : PostgreSQL, MySQL, MS SQL Server, Oracle, SQLite - Et spécifiques Cloud : BigQuery, Redshift, Azure SQL, etc.

Et par conséquent, il existe de nombreuses déclinaisons du SQL, que nous appellerons « dialectes » 😊.

Le langage SQL (et ses dialectes) ne cesse d'évoluer. Cette adaptabilité, cette plasticité, et cette simplicité sont des éléments importants du succès du SQL. Ça explique aussi sa longévité (« since 1974 »).

 

Le SQL, un langage pour tous !                                                                        

Habituellement, les langages de programmation sont supposés être utilisés à des fins de …programmation uniquement, mais le SQL est la preuve du contraire : il peut être utilisé par les membres de l'équipe marketing ou commerciale via quelques requêtes pour faire des analyses. Le SQL est également utile pour le secteur financier, car il est indispensable pour parcourir des données souvent innombrables. En conséquence de quoi, on retrouve le SQL absolument partout, y compris dans les couches métiers, encapsulé, ou « raccroché » aux bases de données, ou aux outils de dataviz.  

 

Le SQL, c’est le passé…  Mais surtout l’avenir !                                              

Le SQL fonctionne bien avec des technos anciennes, mais aussi avec celles de demain, les « hot technologies » ! Et c’est la surprise que l’on attendait un peu moins. Car on aurait pu se figurer que la blockchain, l’Intelligence Artificielles finissent par rendre le SQL obsolète. On ne pourra pas présumer de ce que deviendra le SQL dans les années qui viennent, mais jusqu’alors, le SQL a fait preuve d’une résilience remarquable et s’est lové dans les nouvelles technologies avec facilité, profitant de sa grande plasticité et de sa simplicité d'utilisation.   

Les principales bases de données du Cloud utilisent du SQL « enrichi». Mais dans un autre registre, MS Azure a récemment annoncé le lancement de Azure SQL Database Ledger, une solution qui combine la simplicité du SQL pour le stockage centralisé des données, avec la blockchain pour un surcroît de confiance. Citons aussi Dune Analytics, qui permet un accès gratuit à une crypto-analyse complète via de simples requêtes SQL.

Le SQL est aussi présent dans les solutions qui reposent sur l’IA en permettant l’injection de données pour créer et former des modèles d'apprentissage automatique. Le projet SQLFlow exploite le SQL pour prendre en charge les tâches d'IA, notamment la formation et l'évaluation de modèles.

Les plates-formes Big Data utilisent aussi le SQL comme API principale pour gérer les bases de données relationnelles.

 

Les limites du SQL                                                                                            

Presque toutes les technologies de données prennent en charge le SQL (ou ses dialectes !) et permettent l’utilisation de l’interface SQL. On retrouve ainsi du SQL encapsulé pratiquement partout, dans les ETL, dans les outils de dataviz, mais aussi pour alimenter des spreadsheets au départ de simples requêtes, etc. Ce langage est tellement riche, tellement banalisé, que cela génère systématiquement une grande complexité en aval :

- Pour les équipes en charge de la gouvernance des Systèmes d’Information, le reverse engineering pour déconstruire les flux d’information est souvent une gageure.

- Pour les ingénieurs en charge de la maintenance applicative, ce foisonnement est un obstacle à la bonne maîtrise des systèmes d’information.

 

Automatiser le reverse engineering dans les systèmes hétérogènes            

Il est donc primordial de pouvoir automatiser le reverse engineering du code SQL au sein des système pour comprendre de façon exhaustive d’où vient l’information, où elle va, et qui finalement y accède.

Ainsi, il est possible de construire les conditions d’une maintenance efficace, et profiter à plein de la potentialité du SQL. Une solution de data lineage qui va à la fois introspecter les flux dans les couches haute (dataviz) et basses (alimentations), qui va identifier tous les accès Adhoc aura un intérêt certain pour faire cohabiter durablement le SQL avec les systèmes d’information d’aujourd’hui et de demain.    


ellipsys@ellipsys-bi

www.ellipsys-bi.com  

#datalineage 

#sql #plsql #tsql #redshift #bigquery 

Commentaires

Posts les plus consultés de ce blog

La Data Observabilité, Buzzword ou nécessité ?

Migrer de SAP BO vers Power BI, Automatiquement, Au forfait !

BCBS 239 : L'enjeu de la fréquence et de l'exactitude du reporting de risque