Quel type de stockage pour mes données ?

Le monde du décisionnel commence à regorger de solutions de stockage en tout genre. Au niveau des éditeurs nous avons notamment les solutions suivantes :

illu_stockage_type

Si l’on peut globalement classer les technologies de stockage dans 5 grandes catégories (relationnel, relationnel (MPP), NewSQL, NoSQL et Fichiers), ces dernières utilisent toutes une ou plusieurs des 7 méthodes de stockage ci-dessous :

illu_stockage_type2

Zoom sur le stockage relationnel

Le stockage relationnel est le type de stockage le plus répandu dans le monde du décisionnel, il peut être “non-distribué” (un seul serveur) avec des éditeurs comme Oracle et MySQL, ou “distribué” dans le contexte Big data (plusieurs serveurs) avec des solutions comme Teradata ou Netezza.

Il se base sur le principe de table (tableau avec des lignes et des colonnes fixées en amont) et de relations entre ces tables.

Le principal avantage de ces bases et qu’elles respectent les propriétés ACID qui garantissent une cohérence en tout temps des données stockées.

Leur principale faiblesse est leur robustesse, qui ne leur permet pas de s’adapter facilement aux problématiques de temps réel et de Big Data.

Exemple de données stockées : Données de ventes , CRM, gestion des stocks (tables magasins, clients, produits, ventes…) .

Zoom sur le stockage fichiers

Le stockage par fichiers est notamment porté par la solution Hadoop avec Hadoop Distributed File System (HDFS).

Le principe est que l’on peut stocker et manipuler tous les types de fichiers dans leurs formats natifs (docx, pdfs, png, rar, zip etc…) sur un ou plusieurs serveurs.

Le stockage fichiers distribué permet de répondre aux problématiques de Volumétries, Variété et Vélocité (les 3V’s).

Hadoop a également l’avantage de pouvoir être installé sur tous types de serveurs (commodity hardware), ce qui permet de contrôler ses coûts d’infrastructure.

Son plus gros désavantage étant la complexité de son écosystème, perpétuellement en évolution, et comprenant de nombreux modules permettant d’apporter des fonctionnalités complémentaires .

Exemple de données stockées : Tous les types de données possibles : photos, vidéo, logs, fichiers (xls, doc, json …..).

Stockage colonne, graph, clé/valeur et document

Les types de stockages colonnes, graphes, clé valeur et documents sont portés par des solutions dites ‘Not Only SQL’ ou encore NoSQL.

Certaines de ces solutions sont Open Sources, elles ont globalement l’avantage d’être adaptées au Big data mais elles sont souvent spécialisées pour un contexte particulier. Pour en savoir plus cliquez ici.

Exemple de données stockées : données issues de réseaux sociaux, de réseaux de transport pour les bases graphes (entre autres), données clients pour les bases orientées documents…

Conclusion

Tous les types de stockages énoncés ci-dessus peuvent s’avérer complémentaires, chacun ayant ses avantages et inconvénients. Des articles plus détaillés vous permettront d’en savoir plus.

Article écrit par Anne-Sophie LAUGIER et Louis-Baptiste FRANCE

Laisser un commentaire