気候

気候変動への耐性ある意思決定の予測

気象リスク、エネルギー需要、環境適応のための高速シミュレーション・ツール。

領域短期気象 · エネルギー需要 · インフラ
出力校正された不確実性バンドを伴うヘッドライン数値
テストリーダーボード順位ではなく、信頼性ダイアグラム
予測ファン · 24ステップ先 0.2 0.4 0.6 0.8 1.0 normalised demand +24 h → P25–P75 P10–P90 P5–P95 median
なぜこれが重要か

予測は正確であるだけでなく、実行可能でなければならない

予測は、誰かがそれに基づいて行動できて初めて有用になります。私たちの気候への取り組みは、従来のシミュレーションが遅すぎ、標準的なMLが脆すぎる領域を対象とし、すべてのヘッドライン数値とともに不確実性を浮かび上がらせ、意思決定を根拠づけられるものにします。

正確

リーダーボード指標を最小化する点予測。どこに自信があり、どこが当て推量なのかを示さないことが多い。

実行可能

オペレーターが読み解き、根拠づけ、明文化されたポリシーの下で行動できる、校正されたバンドを伴うヘッドライン数値。

対象領域

従来のシミュレーションが遅すぎ、標準的なMLが脆すぎるところ

R1

短期気象リスク

報いるもの 物理が遅すぎ、素朴なMLが脆すぎる分・時間スケールの窓 罰するもの 何かが壊れるまで不確実性を隠す点予測
R2

エネルギー需要

報いるもの オペレーターが余裕を正直に見積もれるよう、校正された裾を伴う負荷予測 罰するもの レジーム変化をまたいで平滑化する平坦なヘッドライン
R3

インフラ計画

報いるもの 誤りのコストを伴う、ホライズン単位の意思決定 罰するもの 意思決定の面を欠いたリーダーボード精度
校正

分位点が揃ったとき、予測は正直になる

結果の90 %をカバーする90 %バンドは校正されています。私たちは出荷するすべてのモデルで信頼性ダイアグラムを報告します — それが対角線上に乗らなければ、実行可能ではありません。

0.00 0.00 0.25 0.25 0.50 0.50 0.75 0.75 1.00 1.00 perfectly calibrated observed quantile predicted quantile → calibrated uncalibrated baseline
対角線が目標です。シアンの線が私たちの出荷物。破線のマゼンタは、同じデータ上で校正されていないベースラインがどう見えたかを示します。
意思決定の面

ヘッドライン数値だけでは意思決定にならない

すべての出力には、オペレーターが判断を下すために必要なバンドが付いています。アクションの列は成果物の一部であり、後付けではありません。

シグナル ヘッドライン バンド アクション 緊急度
peak load 8.4 GW 7.9 – 9.0 GW (P10–P90) arm 1.1 GW reserve high
6-hour gust risk 38 % 24 – 54 % (P25–P75) pre-stage crew medium
next-day temp +1.6 °C +0.9 – +2.4 °C shift maintenance low
flood window 14:00–17:00 70 – 92 % within window open sluice gates high

より高速で校正された予測

私たちのモデルは、従来のシミュレーションが遅すぎ、従来のMLが脆すぎる領域、すなわち短期気象リスク、エネルギー需要、インフラ計画を対象とします。

数値だけでなく、意思決定を

予測は、人がそれに基づいて行動できて初めて有用になります。私たちは、ヘッドライン数値とともに不確実性を浮かび上がらせ、意思決定をより根拠づけやすくする出力を設計します。

横断テーマ

校正は指標ではなく、規律である

ここで適用するのと同じ信頼性の精査が、私たちの評価ライブラリとアラインメント姿勢へと受け継がれます。不確実性について嘘をつく予測は、リーダーボードの外れ値ではなく、失敗したシステムとして扱われます。