地震分野の課題
「地震波形デノイジング」
「地震波形デノイジング」
現在、わが国には2,000点を越える地震観測点が設置されており、昼夜たえなく地震観測を実施しています。これによって得られる地震波形データは、各観測点における地動の速度あるいは加速度の時系列です。地震が発生し、それに伴う地震波が各観測点に到達すると、図1のように、波形データにまずP波(青線)が、次いでS波(赤線)が現れます。
図1: MeSO-netで観測された地震波形の例
GeoSciAI2025地震課題では、このような地震発生時の地震波形の信号対雑音比(SNR)を向上させる「地震波形デノイジング深層学習モデルの開発」にチャレンジして頂きます。
地震波形デノイジングのための深層学習モデル(デノイザー)の例としては、DeepDenoiserが挙げられます。
DeepDenoiserはSeisBenchパッケージ内で使用することができます。
※参考文献:Woollam et al. (2022) https://doi.org/10.1785/0220210324
このモデルを日本の地震波形データにそのまま適用してもデノイジングは概ね上手くできますが(図2)、これらのモデルの学習段階においては日本の地震波形データを使用しておらず、まだ向上の余地があるはずです。日本の地震波形データに対して、DeepDenoiserよりも良い性能を持つデノイザーの開発を、ぜひ目指して下さい。
図2: DeepDenoiserによるMeSO-netデータのデノイジングの例(信号対雑音比SNRの定義はC.を参照)
本課題で使用する地震波形データおよびサンプルプログラム:
https://drive.google.com/drive/folders/1W29X8w4VSANKBZ8IPlPpH8nUAdd8OAtW?usp=drive_link
地震波形データ
本課題で使用する地震波形データは、上記のGoogleドライブのdataフォルダ以下にnpz形式で格納されており、3月31日に公開する学習データ(Learning)と、4月15日に公開するテストデータ(Test)とで、フォルダが分けられています。
地震波形データは、首都圏地震観測網(MeSO-net)で得られたもののうち、東京大学地震研究所から公開されている手法検証用の「首都圏観測地震波形データセット」(MeSO-netの13観測点において、2011年9月4日〜16日に観測された地震に関するデータ)の一部です。
参考:https://www.eri.u-tokyo.ac.jp/project/iSeisBayes/dataset/
各npzファイルには、発生した各地震イベントの各観測点における地震波形3成分(東西・南北・上下成分)データ、およびP波走時(P波到来時刻)とS波走時(P波到来時刻)が含まれています。ファイル名は、地震発生時刻(年月日.時分秒)+観測点名です(地震発生時刻とは震源で地震が発生した時刻のことであり、当然ながら各観測点におけるP波・S波走時とは異なります)。本来のMeSO-netデータは200Hzサンプリング(1秒間に200回計測)ですが、ここで提供しているデータは100Hzにダウンサンプリングしています。
なお、図3に示す時間窓を設定できるような波形のみが含まれています。
注意:本データはGeoSciAI2025地震課題応募の目的のみに使用可能です。他の研究目的で使用する場合には、東京大学地震研究所共同利用へのデータ利用申請が必要となりますのでご注意下さい。データの第三者への再配布や商用利用は固くお断りいたしますが、GeoSciAI2025への参加が目的であれば、営利企業においてのデータ利用は問題ありません。
サンプルプログラム
サンプルプログラムsample_code.ipynbは、地震波形データの読み出しのほか、C.で述べる評価関数の計算も可能となっています。評価関数の計算には、必ずこのサンプルプログラムを使用して下さい。
図3: 時間窓の設定
各記号の定義と意味
eq : 地震イベント番号
st : 観測点番号
el : 成分名(el = EW [東西], NS [南北], UD [上下])
P, S : シグナル時間窓(P波走時またはS波走時の直後5秒間)
noise : ノイズ時間窓(P波走時の直前5秒間)
Neq : 地震イベント数
Nst : 観測点数(地震イベントによって、Nstの値が変わり得ることに注意)
Nel : 波形成分数(Nel = 3)
A(t) : 波形データ
T : 時間窓に含まれる観測時刻の集合(図3参照)
NT : 時間窓内に含まれるデータ点数(NT = 500)
μ : 時間窓内のデータの平均
σ : 時間窓内のデータの標準偏差
~ : 記号の上に何も付けられていない場合はオリジナル波形に関する量を、チルダが付けられている場合はデノイズ後の波形に関する量を表す。
評価関数
テストデータに対し、次の評価関数Eの最大化を図ることが、本課題の目標となります。
ただし、Eの算出根拠の確認のため、B.で提供したサンプルプログラムを用いて、P波・S波それぞれの各eq・各st・各elについて、テストデータに対するSNRとCCの値をCSV形式で出力したものをご提出頂きます。
SNR:デノイズ後の波形の信号対雑音比(SN比)
CC:デノイズ前の波形とデノイズ後の波形の相互相関
「投稿方法」のページに記載がありますが、ここでは地震課題に特有の内容を記載しておきます。
Technical Paper
テストデータのいくつかについて、オリジナル波形とデノイズ後の波形を比較する図面を掲載して下さい。
将来的に地震研究に役立つ可能性がある内容を期待していますので、単に評価関数値を最大化することに特化した極端に恣意的な操作であると審査員が判断した場合には、応募者への予告なく授賞対象から除外する場合があります。
サマリースライド
評価関数算出の根拠ファイル(CSV形式)
B.で記載したサンプルプログラムを用いて、P波・S波それぞれの各eq・各st・各elについて、テストデータに対するSNRとCCの値をCSV形式に出力して下さい。