Airflow
Airflow est un orchestrateur de workflows orienté data.
Il permet de planifier, structurer et superviser des pipelines de données sous forme de DAG (Directed Acyclic Graph).
Utilisé pour :
- pipelines ETL / ELT
- tâches batch
- entraînement de modèles
- automatisation data
- orchestration multi-services
🧱 Fondamentaux#
⚙️ Construire un pipeline#
🏗️ Exécution & orchestration#
- Scheduling & triggers
- Retries, SLA & gestion des erreurs
- XCom & passage de données
- DockerOperator & exécution isolée