1. 土地被覆分類とは?
たかが地図と思うなかれ
地表面の生物・物理的に何に覆われているかを「土地被覆(land cover)」、人間活動による土地の利用状況を「土地利用(land use)」といい、これらを地図化したものを土地利用/土地被覆図といいます(以下、単に土地被覆図と呼びます)。
土地被覆図は、防災・農業・生態系・環境モニタリング等の分野で活用される基盤情報です。国土地理院の地理院地図は義務教育でも習うので有名ですね。このほか日本国内だけでも、環境省の日本植生図や、JAXAの高解像度土地利用土地被覆図など、様々な用途に応じた土地被覆図が様々な機関によって作成され公開されています[1]。
衛星画像を利用する
こういった土地被覆図は、伝統的には実際に現地に赴いて測量を実施したり、航空機による空中写真を判読したりして作られてきましたが、1972年にアメリカの商用衛星Landsat1号が打ち上げられたのを皮切りに、衛星画像が盛んに使用されるようになってきました(衛星リモートセンシング、略して衛星リモセンといいます)。
衛星画像によって土地被覆図を作ることのメリットですが、
広域が観測できる。特に全球(地球全部のことです)の地図を作る際にはほとんど必須。
定期的に自動観測できる。土地被覆の変化を追うのに有用。
があります。衛星を利用した全球土地被覆図としては、古くはIGBP DISCoverやGLC2000、UMDなどが有名です。そのほかにもMODISのプロダクトやGlobCover2009をはじめ、世界中で多数のプロダクトが作成されています。近年では、衛星データの蓄積(ビッグデータ化)や解析用コンピュータの性能向上が追い風となって、ルールベースや機械学習(いわゆるAI)による画素分類で、複数の衛星画像から土地被覆図をつくるのが主流になってきています[2]。
このチュートリアルでは、衛星画像に機械学習を適用することで土地被覆分類をやってみることにします。
「すでに世にこれだけ土地被覆図が溢れているのに、新しく地図を作ってなにが嬉しいのか」と思うかもしれませんが、既存の全球土地被覆図の比較検証を行うと、精度は7割程度しかないとも言われています [3]。つまり、驚くかもしれませんが、21世紀の人類がもつ「全世界の地表面がどうなっているか」を示した地図にはいまだ3割もの不確かさがあるのです。こういう不確かさは、たとえば土地被覆図を基盤情報として利用する気象シミュレーションの精度に影響を与えます。すると将来気候がどうなるか?などを精度よく議論したいときに、いつまでも悩みの種になります [4]。同様の事情から、地域スケールで土地利用の変化を調べたり、水や炭素、エネルギーの移動/循環などに関わるシミュレーションをしたい場合、けっきょく自分で精度の良いローカル土地被覆図を作らざるをえないことはしばしばあります。
あと、衛星画像への機械学習の応用問題として土地被覆分類は一番わかりやすいので、教育的にためになる、みたいな側面もあります。近年は第三次機械学習ブームですし、とにかくリモセンで機械学習やってみたい、という人のとっかかりとしては非常にいいのではないでしょうか。
というわけで、やってみましょう。
[1] ある土地被覆のみ(森林とか、水域とか)に注目して作成した図は主題図(thematic map)とも呼ばれます。
[2] 近年では画素ごとの分類というよりまずセグメンテーションをかけたりもしますが…
[3] Congalton et al., 2014. doi:10.3390/rs61212070
[4] Feddema et al., 2005. doi:10.1126/science.1118160