気象分野の課題
「台風の24時間後の最大風速を予測しよう」
1. はじめに
熱帯低気圧(台風やハリケーンなど発生海域により呼称が異なります。本コンペでは熱帯低気圧全般のことを台風と呼ぶことにします。)の強度を高精度に予測することは防災の観点から非常に重要です。気象予測に用いられる数値モデルの発展などにより、台風の進路の予測精度はこの数10年で劇的に高くなった一方で、強度の予測精度はそれほど向上していないのが現状です(たとえば気象庁の台風予報の精度検証結果参照)。
本コンペでは水平格子間隔14kmの全球大気数値シミュレーションで計算された台風を擬似的な「観測」データとして、現在と過去の「観測」データから24時間後の台風の最大風速を機械学習で予測することを競います。
急な発達や減衰をいかに精度良く予測するかは、現在、台風研究でホットなトピックです。皆さんのチャレンジお待ちしております!
2. 評価について
評価は最大風速の二乗平均平方根誤差(RMSE;平均二乗誤差(MSE)の平方根を取ったもの)で行います。後日公開されるテスト用データを用いてモデルの評価を行ってください。評価はLife-stage labelが1のものの可能な限りすべてについて行ってください(5/13追記)。
3. データについて
データはこちらからダウンロード(tar.gz形式で約8GB。解凍後約11GB)できます。提供されているデータ以外のデータをモデル構築に用いることは禁止します。
提供されるデータは台風のトラックデータと台風中心の周囲約1000km四方の2次元大気データに大きく分かれます。
トラックデータ
track_dataディレクトリに配置されているCSV形式のファイル。
台風1つにつき、1ファイル。
ファイル名は[発生時刻のYYYYmmddHH]_lon[発生位置の東経(整数3ケタ)]_lat[発生位置の緯度(整数2ケタ)][北緯か南緯かでn|s].csv
2次元大気データ
field_dataディレクトリ下に年ごとのディレクトリがあり、変数ごとのディレクトリがあり、その下に配置される。
64x64のnpz形式
ファイル名は[変数名の小文字]_[時刻のYYYYmmddHH]_lon[中心位置の東経(整数3ケタ)]_lat[中心位置の緯度(整数2ケタ)][北緯か南緯かでn|s].npz
変数の意味は以下の通り
OLR(外向き長波放射)
QV600(600hPa(高度約4.5km)比湿)
SLP(海面更正気圧)
SST(海面水温)
U200(200hPa(高度約12km)東西風)
U850(850hPa(高度約1.5km)東西風)
V200(200hPa(高度約12km)南北風)
V850(850hPa(高度約1.5km)南北風)
4. チュートリアルを兼ねた例
もとのファイル(ipynb)はこちらからダウンロードできます。google colabでも見えますので、ファイル名など適宜書き換えてご利用ください。以下にもとのファイルをHTMLに変換して埋め込んでみました。多少はみ出てますが、雰囲気はつかめるでしょう。