Time series & Causal inference
Différents éléments théoriques sur les time series et causal inference.
💼 Problèmes business récurrents#
- Forecasting business (demand forecasting, revenue forecasting, …)
- Impact et décisions (marketing, pricing, product changes)
- Allocation (budget marketing, stock, ressources)
🧱 Fondations#
- Statistiques et probabilités (distribution, estimation, intervalles de confiance)
- Modélisation (biais/variance, régularisation, validation)
- Modélisation des données (DGP) (génération des données, dépendances temporelles)
⏱️ Time Series#
- Fondamentaux (stationnarité, autocorrélation, décomposition)
- Modèles classiques (AR / MA / ARMA / ARIMA)
- Feature engineering temporel (lags, rolling stats)
- Validation et pièges (time-based CV, data leakage)
- Avancé / Moderne (multivariate time series, hierarchical forecasting)
- Probabilistic forecasting (quantiles, prédiction de distribution)
🔬 Causal Inference#
- Bases (corrélation, causalité, DAGs, variables confondantes)
- Méthodes fondamentales (A/B testing, matching)
- Méthodes avancées (Diff-in-Diff, instrumental variables, causal forests
- Données observationnelles (identification strategy, hypothèses, robustesse)
- Interprétation business (explicabilité, transformation)
- Identification (définitions, hypothèses clés, biais, tests)
- Causalité longitudinale (time-variying confounders, g-methods)
- Outils pratiques (DoWhy, EconML, grf, causalml)
🔗 Le pont Time Series × Causal#
- Causalité dans le temps (causal impact, intervention analysis)
- Évaluation d’actions dans le temps (effet d’une promo, changement de prix)
- Forecast + décision (intégration scénarios, simulation politiques)
- Contrefactuel (“what-if”, uplift modeling, policy evaluation)
⚙️ Industrialisation & Fiabilité#
- Pipelines temporels (feature pipelines, gestion du temps, batch vs stream)
- Backtesting et validation robuste (rolling windows, stabilité des performances, baseline)
- Production et monitoring (retraining, drift, suivi des performances)
- Scalabilité et performance (gros volume temporels, optimisation du temps de calcul)
- Versioning et reproductibilité (modèles, dataset, expériences)
- Communication et décision (dashboards orientés décision, storytelling)