On ne s’intéresse plus à une intervention ponctuelle, mais à des situations où tout évolue dans le temps :
- traitements répétés (campagnes marketing, pricing dynamique…)
- comportements utilisateurs qui changent
- variables qui influencent à la fois le futur et les décisions
👉 On entre dans un cadre longitudinal : données observées sur plusieurs périodes.
⏳ Le problème clé : les time-varying confounders#
Un confounder classique influence :
- le traitement
- et le résultat
Mais ici, il a une particularité supplémentaire :
👉 il évolue dans le temps 👉 et il peut être lui-même influencé par les traitements passés
Exemple simple :
On envoie des promotions aux clients les plus actifs
Mais :
- l’activité passée influence la promo (ciblage)
- la promo influence l’activité future
👉 Donc : l’activité est à la fois confounder et variable affectée par le traitement
C’est là que les méthodes classiques (régression, matching…) cassent.
⚠️ Pourquoi les méthodes classiques ne marchent pas#
Si on ajuste naïvement sur ces variables :
- on bloque une partie de l’effet causal
- ou on introduit du biais
👉 On contrôle une variable qui est sur le chemin causal
Résultat : → estimation biaisée, souvent difficile à détecter
🧠 Idée générale des g-methods#
Les g-methods sont faites pour ça :
👉 estimer des effets causaux quand les confounders évoluent dans le temps
Elles reposent sur une idée simple :
On reconstruit ce qui se serait passé sous différents scénarios de traitement
🔧 g-computation#
On modélise :
- l’évolution du système dans le temps
- la relation entre variables, traitement et outcome
Puis :
👉 on simule différents scénarios (ex : toujours traité vs jamais traité)
Concrètement :
- on entraîne des modèles (souvent séquentiels)
- on simule des trajectoires
- on compare les résultats
💡 Intuition : → on recrée un monde contrefactuel “propre”
⚖️ Marginal Structural Models (MSM)#
Approche différente :
👉 on repondère les observations pour “casser” les biais
On construit des poids tels que :
le traitement devient indépendant des confounders passés
Ensuite :
- on fait une régression pondérée
- et on récupère un effet causal
💡 Intuition : → recréer artificiellement un pseudo-randomized experiment
📈 Effets cumulés#
Dans ce cadre, on ne regarde plus juste :
👉 effet à un instant t
Mais :
👉 effet cumulé dans le temps
Exemples :
- effet d’une promo répétée
- impact d’un pricing dynamique
- influence d’un onboarding progressif
👉 Les effets peuvent :
- s’accumuler
- s’atténuer
- ou interagir dans le temps
🧩 Longitudinal causal inference#
Ce cadre général combine :
- dépendances temporelles
- traitements répétés
- confounding dynamique
👉 Objectif :
estimer des politiques de traitement dans le temps
Pas juste :
- “est-ce que ça marche ?”
Mais :
- “quelle stratégie dans le temps fonctionne le mieux ?”
🧠 À retenir#
Dans le temps, les variables deviennent dynamiques et interdépendantes
Les confounders peuvent être affectés par le traitement
Les méthodes classiques ne suffisent plus
Les g-methods permettent de :
- simuler (g-computation)
- repondérer (MSM)
On raisonne en trajectoires et effets cumulés
