On ne trouve pas une architecture idéale, mais des approches à combiner selon le contexte (cas d’usage, équipes, budget, niveau de maturité).
Voici un tour d’horizon simplifié, puis l’architecture en médaillons (bronze / silver / gold) qui sert souvent de socle.
Data Warehouse (DW)#
- Idée : on centralise des données structurées pour la BI et le reporting.
- Points forts : données cohérentes, performances en lecture, base mature.
- Limites : conception coûteuse, moins souple pour des usages non-BI.
- Quand : reporting d’entreprise, historique, suivi KPI.
Data Lake#
- Idée : on stocke brut (structuré, semi-structuré, non structuré), puis on transforme à la demande.
- Points forts : ingestion rapide, stockage économique et massif.
- Limites : risque de data swamp sans gouvernance ni organisation.
- Quand : exploration, ML/IA, logs, IoT, grosses volumétries.
Modern Data Warehouse (MDW)#
- Idée : on combine lake + warehouse (souvent managé dans le cloud).
- Points forts : variété de sources, scalabilité, temps réel possible.
- Limites : deux systèmes à synchroniser (coûts, gouvernance plus complexe).
- Quand : besoin d’analytique performant tout en gardant la souplesse d’un lake.
Data Fabric#
- Idée : on fédère les sources (virtualisation, MDM, catalogues, gouvernance), sans tout déplacer.
- Points forts : accès unifié, métadonnées et gouvernance au cœur.
- Limites : mise en œuvre exigeante (technique + conduite du changement).
- Quand : SI morcelé (multi-cloud / on-prem), besoin d’accès transverse en self-service.
Data Lakehouse#
- Idée : on unifie stockage économique et capacités analytiques (formats transactionnels, gouvernance).
- Points forts : moins de duplication que le MDW, données plus fraîches, plateforme unique.
- Limites : socle encore jeune selon les contextes, mise en place experte.
- Quand : usages modernes (temps réel, ML, BI) avec une seule plateforme.
Data Mesh#
- Idée : on décentralise par domaine et on traite les données comme des produits sur une plateforme self-service, avec gouvernance fédérée.
- Points forts : qualité et ownership alignés sur le métier, passage à l’échelle organisationnel.
- Limites : forte transformation culturelle, outillage et standards Ă cadrer.
- Quand : grandes organisations distribuées, besoin d’autonomie par domaine.
L’architecture en médaillons (Bronze / Silver / Gold)#
On organise le lake (ou le lakehouse) en couches pour maîtriser qualité et usages :
- Bronze : données brutes immuables (staging / raw).
- Silver : données nettoyées / harmonisées (encodage, schémas, typages, jointures essentielles).
- Gold : données prêtes à consommer (logique métier, agrégations, vues pour BI / produits).
Cette structuration évite le data swamp, facilite la traçabilité, et accélère l’accès aux données selon les besoins.
Comment choisir (raccourcis utiles)#
- BI surtout structurée et gouvernée
→ on privilégie DW (ou MDW si besoin de sources variées et scalables). - Exploration, ML/IA, multimodal
→ on part sur Data Lake (ou Lakehouse si on veut unifier gouvernance + analytique). - SI très distribué, besoin d’un accès unifié sans tout copier
→ on regarde Data Fabric. - Grande entreprise avec domaines autonomes
→ on adopte progressivement Data Mesh (plateforme + standards + ownership métier). - Envie d’un socle unique et moderne
→ on évalue Lakehouse ; les médaillons servent de fil conducteur (bronze/silver/gold).
Comparatif#
| Critère | DW | Data Lake | MDW | Data Fabric | Lakehouse | Data Mesh |
|---|---|---|---|---|---|---|
| Typologie | Centralisé | Centralisé (brut) | Lake + DW | Fédéré/virtuel | Unifié | Décentralisé |
| Points forts | Robustesse BI | Souplesse + coût | Mix souple + perf | Accès unifié | Une seule plateforme | Ownership métier |
| Points faibles | Peu flexible | Risque swamp | Double coût/complexité | Mise en œuvre lourde | Jeunesse selon contextes | Changement culturel |
| Usages phares | Reporting/KPI | ML/Exploration | BI + sources variées | Self-service distribué | BI+ML temps quasi réel | Grande orga par domaines |
Ă€ retenir
On assemble souvent plusieurs briques. Les médaillons servent d’ossature de qualité, et la gouvernance (catalogue, MDM, sécurité, lineage) reste incontournable — quelle que soit l’architecture choisie.