Causalité longitudinale

TimeSeries - Cet article fait partie d'une série.

Partie 19: Cet article

On ne s’intéresse plus à une intervention ponctuelle, mais à des situations où tout évolue dans le temps :

traitements répétés (campagnes marketing, pricing dynamique…)
comportements utilisateurs qui changent
variables qui influencent à la fois le futur et les décisions

👉 On entre dans un cadre longitudinal : données observées sur plusieurs périodes.

⏳ Le problème clé : les time-varying confounders
#

Un confounder classique influence :

le traitement
et le résultat

Mais ici, il a une particularité supplémentaire :

👉 il évolue dans le temps 👉 et il peut être lui-même influencé par les traitements passés

Exemple simple :

On envoie des promotions aux clients les plus actifs
Mais :
- l’activité passée influence la promo (ciblage)
- la promo influence l’activité future

👉 Donc : l’activité est à la fois confounder et variable affectée par le traitement

C’est là que les méthodes classiques (régression, matching…) cassent.

⚠️ Pourquoi les méthodes classiques ne marchent pas
#

Si on ajuste naïvement sur ces variables :

on bloque une partie de l’effet causal
ou on introduit du biais

👉 On contrôle une variable qui est sur le chemin causal

Résultat : → estimation biaisée, souvent difficile à détecter

🧠 Idée générale des g-methods
#

Les g-methods sont faites pour ça :

👉 estimer des effets causaux quand les confounders évoluent dans le temps

Elles reposent sur une idée simple :

On reconstruit ce qui se serait passé sous différents scénarios de traitement

🔧 g-computation
#

On modélise :

l’évolution du système dans le temps
la relation entre variables, traitement et outcome

Puis :

👉 on simule différents scénarios (ex : toujours traité vs jamais traité)

Concrètement :

on entraîne des modèles (souvent séquentiels)
on simule des trajectoires
on compare les résultats

💡 Intuition : → on recrée un monde contrefactuel “propre”

⚖️ Marginal Structural Models (MSM)
#

Approche différente :

👉 on repondère les observations pour “casser” les biais

On construit des poids tels que :

le traitement devient indépendant des confounders passés

Ensuite :

on fait une régression pondérée
et on récupère un effet causal

💡 Intuition : → recréer artificiellement un pseudo-randomized experiment

📈 Effets cumulés
#

Dans ce cadre, on ne regarde plus juste :

👉 effet à un instant t

Mais :

👉 effet cumulé dans le temps

Exemples :

effet d’une promo répétée
impact d’un pricing dynamique
influence d’un onboarding progressif

👉 Les effets peuvent :

s’accumuler
s’atténuer
ou interagir dans le temps

🧩 Longitudinal causal inference
#

Ce cadre général combine :

dépendances temporelles
traitements répétés
confounding dynamique

👉 Objectif :

estimer des politiques de traitement dans le temps

Pas juste :

“est-ce que ça marche ?”

Mais :

“quelle stratégie dans le temps fonctionne le mieux ?”

🧠 À retenir
#

Dans le temps, les variables deviennent dynamiques et interdépendantes
Les confounders peuvent être affectés par le traitement
Les méthodes classiques ne suffisent plus
Les g-methods permettent de :
- simuler (g-computation)
- repondérer (MSM)
On raisonne en trajectoires et effets cumulés

Auteur

Thibault CLEMENT - Intechnia

Data scientist

TimeSeries - Cet article fait partie d'une série.

Partie 1: Forecasting business

Partie 2: Impact et décisions

Partie 3: Allocation

Partie 4: Statistiques et probabilités

Partie 5: Modélisation

Partie 6: Modélisation DGP

Partie 7: Fondamentaux (stationnarité, autocorrélation, décomposition)

Partie 8: Modèles classiques (AR / MA / ARMA / ARIMA)

Partie 9: Feature engineering temporel (lags, rolling stats)

Partie 10: Validation et pièges (time-based CV, data leakage)

Partie 11: Avancé / Moderne (multivariate time series, hierarchical forecasting)

Partie 12: Probabilistic forecasting (quantiles, prédiction de distribution)

Partie 13: Modélisation DGP

Partie 14: Méthodes fondamentales - Causalité

Partie 15: Méthodes avancées - Causalité

Partie 16: Données observationnelles

Partie 17: Interprétation business

Partie 19: Cet article

⏳ Le problème clé : les time-varying confounders#

⚠️ Pourquoi les méthodes classiques ne marchent pas#

🧠 Idée générale des g-methods#

🔧 g-computation#

⚖️ Marginal Structural Models (MSM)#

📈 Effets cumulés#

🧩 Longitudinal causal inference#

🧠 À retenir#