Aller au contenu

Causalité longitudinale

·3 mins·
TimeSeries - Cet article fait partie d'une série.
Partie 19: Cet article

On ne s’intéresse plus à une intervention ponctuelle, mais à des situations où tout évolue dans le temps :

  • traitements répétés (campagnes marketing, pricing dynamique…)
  • comportements utilisateurs qui changent
  • variables qui influencent à la fois le futur et les décisions

👉 On entre dans un cadre longitudinal : données observées sur plusieurs périodes.


⏳ Le problème clé : les time-varying confounders
#

Un confounder classique influence :

  • le traitement
  • et le résultat

Mais ici, il a une particularité supplémentaire :

👉 il évolue dans le temps 👉 et il peut être lui-même influencé par les traitements passés

Exemple simple :

  • On envoie des promotions aux clients les plus actifs

  • Mais :

    • l’activité passée influence la promo (ciblage)
    • la promo influence l’activité future

👉 Donc : l’activité est à la fois confounder et variable affectée par le traitement

C’est là que les méthodes classiques (régression, matching…) cassent.


⚠️ Pourquoi les méthodes classiques ne marchent pas
#

Si on ajuste naïvement sur ces variables :

  • on bloque une partie de l’effet causal
  • ou on introduit du biais

👉 On contrôle une variable qui est sur le chemin causal

Résultat : → estimation biaisée, souvent difficile à détecter


🧠 Idée générale des g-methods
#

Les g-methods sont faites pour ça :

👉 estimer des effets causaux quand les confounders évoluent dans le temps

Elles reposent sur une idée simple :

On reconstruit ce qui se serait passé sous différents scénarios de traitement


🔧 g-computation
#

On modélise :

  • l’évolution du système dans le temps
  • la relation entre variables, traitement et outcome

Puis :

👉 on simule différents scénarios (ex : toujours traité vs jamais traité)

Concrètement :

  1. on entraîne des modèles (souvent séquentiels)
  2. on simule des trajectoires
  3. on compare les résultats

💡 Intuition : → on recrée un monde contrefactuel “propre”


⚖️ Marginal Structural Models (MSM)
#

Approche différente :

👉 on repondère les observations pour “casser” les biais

On construit des poids tels que :

le traitement devient indépendant des confounders passés

Ensuite :

  • on fait une régression pondérée
  • et on récupère un effet causal

💡 Intuition : → recréer artificiellement un pseudo-randomized experiment


📈 Effets cumulés
#

Dans ce cadre, on ne regarde plus juste :

👉 effet à un instant t

Mais :

👉 effet cumulé dans le temps

Exemples :

  • effet d’une promo répétée
  • impact d’un pricing dynamique
  • influence d’un onboarding progressif

👉 Les effets peuvent :

  • s’accumuler
  • s’atténuer
  • ou interagir dans le temps

🧩 Longitudinal causal inference
#

Ce cadre général combine :

  • dépendances temporelles
  • traitements répétés
  • confounding dynamique

👉 Objectif :

estimer des politiques de traitement dans le temps

Pas juste :

  • “est-ce que ça marche ?”

Mais :

  • “quelle stratégie dans le temps fonctionne le mieux ?”

🧠 À retenir
#

  • Dans le temps, les variables deviennent dynamiques et interdépendantes

  • Les confounders peuvent être affectés par le traitement

  • Les méthodes classiques ne suffisent plus

  • Les g-methods permettent de :

    • simuler (g-computation)
    • repondérer (MSM)
  • On raisonne en trajectoires et effets cumulés

Thibault CLEMENT - Intechnia
Auteur
Thibault CLEMENT - Intechnia
Data scientist
TimeSeries - Cet article fait partie d'une série.
Partie 19: Cet article