Aller au contenu

Architectures data : panorama rapide

·3 mins·
Industrialisation
IndustrialisationProjet - Cet article fait partie d'une série.
Partie 3: Cet article

On ne trouve pas une architecture idéale, mais des approches à combiner selon le contexte (cas d’usage, équipes, budget, niveau de maturité).
Voici un tour d’horizon simplifié, puis l’architecture en médaillons (bronze / silver / gold) qui sert souvent de socle.

Data Warehouse (DW)
#

  • IdĂ©e : on centralise des donnĂ©es structurĂ©es pour la BI et le reporting.
  • Points forts : donnĂ©es cohĂ©rentes, performances en lecture, base mature.
  • Limites : conception coĂ»teuse, moins souple pour des usages non-BI.
  • Quand : reporting d’entreprise, historique, suivi KPI.

Data Lake
#

  • IdĂ©e : on stocke brut (structurĂ©, semi-structurĂ©, non structurĂ©), puis on transforme Ă  la demande.
  • Points forts : ingestion rapide, stockage Ă©conomique et massif.
  • Limites : risque de data swamp sans gouvernance ni organisation.
  • Quand : exploration, ML/IA, logs, IoT, grosses volumĂ©tries.

Modern Data Warehouse (MDW)
#

  • IdĂ©e : on combine lake + warehouse (souvent managĂ© dans le cloud).
  • Points forts : variĂ©tĂ© de sources, scalabilitĂ©, temps rĂ©el possible.
  • Limites : deux systèmes Ă  synchroniser (coĂ»ts, gouvernance plus complexe).
  • Quand : besoin d’analytique performant tout en gardant la souplesse d’un lake.

Data Fabric
#

  • IdĂ©e : on fĂ©dère les sources (virtualisation, MDM, catalogues, gouvernance), sans tout dĂ©placer.
  • Points forts : accès unifiĂ©, mĂ©tadonnĂ©es et gouvernance au cĹ“ur.
  • Limites : mise en Ĺ“uvre exigeante (technique + conduite du changement).
  • Quand : SI morcelĂ© (multi-cloud / on-prem), besoin d’accès transverse en self-service.

Data Lakehouse
#

  • IdĂ©e : on unifie stockage Ă©conomique et capacitĂ©s analytiques (formats transactionnels, gouvernance).
  • Points forts : moins de duplication que le MDW, donnĂ©es plus fraĂ®ches, plateforme unique.
  • Limites : socle encore jeune selon les contextes, mise en place experte.
  • Quand : usages modernes (temps rĂ©el, ML, BI) avec une seule plateforme.

Data Mesh
#

  • IdĂ©e : on dĂ©centralise par domaine et on traite les donnĂ©es comme des produits sur une plateforme self-service, avec gouvernance fĂ©dĂ©rĂ©e.
  • Points forts : qualitĂ© et ownership alignĂ©s sur le mĂ©tier, passage Ă  l’échelle organisationnel.
  • Limites : forte transformation culturelle, outillage et standards Ă  cadrer.
  • Quand : grandes organisations distribuĂ©es, besoin d’autonomie par domaine.

L’architecture en médaillons (Bronze / Silver / Gold)
#

On organise le lake (ou le lakehouse) en couches pour maîtriser qualité et usages :

  • Bronze : donnĂ©es brutes immuables (staging / raw).
  • Silver : donnĂ©es nettoyĂ©es / harmonisĂ©es (encodage, schĂ©mas, typages, jointures essentielles).
  • Gold : donnĂ©es prĂŞtes Ă  consommer (logique mĂ©tier, agrĂ©gations, vues pour BI / produits).

Cette structuration évite le data swamp, facilite la traçabilité, et accélère l’accès aux données selon les besoins.


Comment choisir (raccourcis utiles)
#

  • BI surtout structurĂ©e et gouvernĂ©e
    → on privilégie DW (ou MDW si besoin de sources variées et scalables).
  • Exploration, ML/IA, multimodal
    → on part sur Data Lake (ou Lakehouse si on veut unifier gouvernance + analytique).
  • SI très distribuĂ©, besoin d’un accès unifiĂ© sans tout copier
    → on regarde Data Fabric.
  • Grande entreprise avec domaines autonomes
    → on adopte progressivement Data Mesh (plateforme + standards + ownership métier).
  • Envie d’un socle unique et moderne
    → on évalue Lakehouse ; les médaillons servent de fil conducteur (bronze/silver/gold).

Comparatif
#

CritèreDWData LakeMDWData FabricLakehouseData Mesh
TypologieCentraliséCentralisé (brut)Lake + DWFédéré/virtuelUnifiéDécentralisé
Points fortsRobustesse BISouplesse + coûtMix souple + perfAccès unifiéUne seule plateformeOwnership métier
Points faiblesPeu flexibleRisque swampDouble coût/complexitéMise en œuvre lourdeJeunesse selon contextesChangement culturel
Usages pharesReporting/KPIML/ExplorationBI + sources variéesSelf-service distribuéBI+ML temps quasi réelGrande orga par domaines

Ă€ retenir

On assemble souvent plusieurs briques. Les médaillons servent d’ossature de qualité, et la gouvernance (catalogue, MDM, sécurité, lineage) reste incontournable — quelle que soit l’architecture choisie.

Thibault CLEMENT - Intechnia
Auteur
Thibault CLEMENT - Intechnia
Data scientist
IndustrialisationProjet - Cet article fait partie d'une série.
Partie 3: Cet article