00_gawkで文字列抽出

AMEDASのサイトで日本周辺の震源データを年ごとにダウンロードできます。

このデータ、テキスト形式なのですが、小数点を省略していたりして、扱いが少々面倒ですが、gawkのスクリプトを使って、GMTで使いやすく加工してみます。一行目のスクリプトでgawkのパスを通しています。gawkをどこに保存したかをc:以降に記載してね!

set path=%PATH%;c:\programs\gawk\bin

set dat=h2011.dat

gawk "{print substr($0, 2, 4), substr($0,6,2),substr($0,8,2),substr($0,22,3)+substr($0,25,4)/100/60,substr($0,33,4)+substr($0,37,4)/100/60,substr($0,45,5)/100,substr($0,53,2)/10 }" %dat% > h2011seis.dat

2行目はAMEDASからダウンロードした2010年の日本周辺の震源データ。

3行目はgawkの文字列コマンド、substrを使って、AMEDASのテキストデータから必要部分を抜き出し、加除してGMT用のデータに吐き出しています。

データの順番は、年、月、日、経度、緯度、深度、マグニチュードです。

オリジナルのデータ

>YYYYMMDDHHMMSSSS LONGITU LATITUD DEPTH MG

J2011010100012561 031 411791 134 1424813 162 22 24V 521 2 60E OFF AOMORI PREF 9K

J2011010100045665 014 352554 039 1395532 072 86839909v 511 3 96TOKYO BAY REGION 11K

J2011010100115880 012 355734 034 1400935 049 588509409V 511 3 87SOUTHERN IBARAKI PREF 19K

J2011010100125696 017 384189 042 1421555 092 357023018V 511 2 65E OFF MIYAGI PREF 21K

J2011010100180285 045 280156 119 1300869 174 22 18v 571 7296NEAR AMAMI-OSHIMA ISLAND 3S

スクリプトで変換したデータ

>YYYY MM DD 0 0 0 0

2011 01 01 41.2985 142.802 0.22 2.4

2011 01 01 35.4257 139.922 8.68 0.9

2011 01 01 35.9557 140.156 58.85 0.9

2011 01 01 38.6982 142.259 35.7 1.8

2011 01 01 28.026 130.145 0.22 1.8

結構便利だと思うのですが、、、、。