Climat

Prévision de décisions climatiques résilientes

Outils de simulation rapide pour le risque météorologique, la demande énergétique et l'adaptation environnementale.

régimesmétéo à court horizon · demande énergétique · infrastructure
sortiechiffre clé associé à une bande d’incertitude calibrée
testdiagramme de fiabilité, et non classement de leaderboard
éventail de prévision · horizon à 24 pas 0.2 0.4 0.6 0.8 1.0 normalised demand +24 h → P25–P75 P10–P90 P5–P95 median
Pourquoi c’est important

Les prévisions doivent être exploitables, pas seulement exactes

Une prévision n’est utile que si quelqu’un peut l’exploiter. Notre travail sur le climat cible les régimes où la simulation traditionnelle est trop lente et le ML standard trop fragile, et il fait apparaître l’incertitude aux côtés de chaque chiffre clé pour que les décisions soient défendables.

exact

une prévision ponctuelle qui minimise une métrique de leaderboard, souvent sans dire où elle est confiante et où elle devine.

exploitable

un chiffre clé associé à une bande calibrée qu’un opérateur peut lire, défendre et exploiter dans le cadre d’une politique écrite.

régimes ciblés

Là où la simulation traditionnelle est trop lente et le ML standard trop fragile

R1

risque météorologique à court horizon

récompense fenêtres de la minute à l’heure où la physique est trop lente et le ML naïf trop fragile pénalise prévisions ponctuelles qui masquent leur incertitude jusqu’à ce que quelque chose casse
R2

demande énergétique

récompense prévisions de charge avec des queues calibrées pour que les opérateurs dimensionnent honnêtement leur marge pénalise chiffres clés plats qui lissent les changements de régime
R3

planification d’infrastructure

récompense décisions d’horizon en horizon associées au coût d’une erreur pénalise exactitude de leaderboard sans surface de décision
calibration

La prévision est honnête quand les quantiles s’alignent

Une bande à 90 % qui couvre 90 % des résultats est calibrée. Nous rapportons le diagramme de fiabilité sur chaque modèle que nous livrons — s’il ne se place pas sur la diagonale, il n’est pas exploitable.

0.00 0.00 0.25 0.25 0.50 0.50 0.75 0.75 1.00 1.00 perfectly calibrated observed quantile predicted quantile → calibrated uncalibrated baseline
La diagonale est la cible. La ligne cyan est ce que nous livrons ; la ligne magenta en pointillés est ce à quoi une référence non calibrée aurait ressemblé sur les mêmes données.
surface de décision

Un chiffre clé à lui seul n’est pas une décision

Chaque sortie est livrée avec la bande dont un opérateur a besoin pour trancher. La colonne action fait partie du livrable, et non d’une réflexion après coup.

signal chiffre clé bande action urgence
peak load 8.4 GW 7.9 – 9.0 GW (P10–P90) arm 1.1 GW reserve high
6-hour gust risk 38 % 24 – 54 % (P25–P75) pre-stage crew medium
next-day temp +1.6 °C +0.9 – +2.4 °C shift maintenance low
flood window 14:00–17:00 70 – 92 % within window open sluice gates high

Des prévisions plus rapides et calibrées

Nos modèles ciblent les régimes où la simulation traditionnelle est trop lente et le ML traditionnel trop fragile : risque météorologique à court horizon, demande énergétique et planification d’infrastructure.

Des décisions, pas seulement des chiffres

Une prévision n’est utile que si une personne peut l’exploiter. Nous concevons des sorties qui font apparaître l’incertitude aux côtés du chiffre clé pour que les décisions soient plus faciles à défendre.

transversalités

La calibration est une discipline, pas une métrique

La même rigueur de fiabilité que nous appliquons ici se retrouve dans notre bibliothèque d’évaluation et notre posture d’alignement. Une prévision qui ment sur son incertitude est traitée comme un système défaillant, et non comme une anomalie de leaderboard.