Aller au contenu

Probabilistic forecasting (quantiles, prédiction de distribution)

·2 mins·
Time Series Probabilistic Forecasting
TimeSeries - Cet article fait partie d'une série.
Partie 12: Cet article

Contrairement au forecasting classique qui prédit une valeur unique, on cherche ici à prédire une incertitude.

En séries temporelles, on ne cherche pas seulement à prédire une valeur future, mais une valeur future incertaine.

👉 Au lieu de dire « on prévoit 100 », on cherche à décrire la distribution de \( y_{t+h} \) sachant le passé


🔹 Pourquoi c’est important en time series ?
#

Une série temporelle est intrinsèquement incertaine :

  • bruit aléatoire
  • chocs (promotions, météo, événements…)
  • dépendances temporelles
  • incertitude qui augmente avec l’horizon

👉 Plus on prédit loin (t+7, t+30…), plus la prévision est incertaine

Donc une valeur unique est souvent trompeuse.


🔹 Quantiles
#

Un quantile donne une borne associée à une probabilité.

  • Q10 → 10% de chances d’être en dessous
  • Q50 → médiane
  • Q90 → 90% de chances d’être en dessous

👉 En séries temporelles, on prédit souvent plusieurs quantiles pour chaque horizon :

  • t+1 → intervalle serré
  • t+7 → intervalle plus large
  • t+30 → intervalle encore plus large

→ l’incertitude est explicitement modélisée dans le temps


🔹 Prédiction de distribution
#

On peut aussi prédire directement une distribution conditionnelle :

\[ y_{t+h} \sim \mathcal{D}(y_t, y_{t-1}, …) \]

Exemples :

  • normale (μ, σ)
  • Poisson (comptage)
  • distributions apprises (deep learning)

👉 Avantage :

  • cohérent avec la nature temporelle du problème
  • permet de dériver tous les quantiles

🔹 Calibration
#

Une bonne prévision probabiliste doit être calibrée dans le temps.

👉 Si on prédit un intervalle à 90%, alors :

  • sur l’ensemble des timestamps, la vraie valeur doit tomber dedans ~90% du temps

Attention en séries temporelles :

  • les erreurs sont corrélées
  • la variance peut évoluer dans le temps

👉 Les intervalles naïfs sont souvent mal calibrés


🔹 Métriques
#

Pinball loss (quantile loss)
#

\[ L_\tau(y, \hat{y}) = (\tau - \mathbf{1}_{y < \hat{y}})(y - \hat{y}) \]

  • utilisée pour entraîner/évaluer les quantiles
  • pénalisation asymétrique (utile en décision)

CRPS
#

  • évalue une distribution complète
  • généralise la MAE aux prévisions probabilistes

👉 prend en compte :

  • l’erreur
  • la dispersion
  • la calibration

🔹 En pratique (time series)
#

On utilise le probabilistic forecasting quand :

  • l’incertitude augmente avec l’horizon
  • les décisions dépendent du risque (stock, pricing…)
  • on veut simuler des scénarios (best / worst case)

👉 Typiquement :

  • supply chain
  • énergie
  • finance

🔹 À retenir
#

  • en séries temporelles, on prédit une distribution future conditionnelle au passé
  • l’incertitude augmente avec l’horizon
  • les quantiles sont une approche simple et efficace
  • la calibration est essentielle
  • une prévision ponctuelle seule est souvent insuffisante
Thibault CLEMENT - Intechnia
Auteur
Thibault CLEMENT - Intechnia
Data scientist
TimeSeries - Cet article fait partie d'une série.
Partie 12: Cet article