応用のためのトポロジカルデータ解析チュートリアル&ワークショップ

トポロジカルデータ解析を幅広い分野で活用するためのソフトウェアの使い方や機械学習への応用方法などに関する実践的なチュートリアルと,応用数学・工学・情報学分野におけるトポロジカルデータ解析の利活用事例や最先端研究に関する情報交換を目的とする分野横断型研究集会を以下の要領で実施します.

  • 日程:2020年6月18日(木),6月19日(金)
  • 共催:東北大学 材料科学高等研究所,東北大学 知の創出センター,JST ACT-X

参加申し込み(必須)はこちらのフォームにご記入ください.

新型コロナウィルス感染症の影響を鑑み,本ワークショップはインターネット会議システム等を利用してリモート開催します.インターネット会議システム接続等に関する詳細は今後,参加者の皆様にメール等でご連絡する予定です.

  • (2020-06-12) 参加申し込みいただいた皆様に Zoom 接続先等に関するお知らせをいたしました.参加申し込みをしたにも関わらず案内の届いていない方は,お手数ですが世話人までご連絡ください.(世話人連絡先はページ末尾をご参照ください.)
  • (2020-06-17) 懇親会・情報交流会の詳細を含む最終版プログラムの案内を参加者の皆様にお送りいたしました.

チュートリアルについて

チュートリアル講師として,理化学研究所革新知能統合研究センター トポロジカルデータ解析チーム研究員の大林一平氏と,九州大学マス・フォア・インダストリ研究所の鍛冶静雄氏をお呼びします.

大林氏はトポロジカルデータ解析による材料科学での逆解析に特化したソフトウェア&ライブラリである HomCloud のメイン開発者であり,今回も HomCloud の利活用方法に関するチュートリアルをしていただく予定です.

鍛冶氏はトポロジーの専門家である一方で,コンピューターグラフィックスなど様々な分野への応用を手掛けており,本チュートリアルでは機械学習でのトポロジカルデータ解析の活用などについてご講演いただく予定です.

チュートリアル講演では,TDAソフトウェアの実演や,参加者の皆さんに実際にソフトウェアを試していただく実践の時間(ハンズオン)をとる予定です.ハンズオンの準備については下記を参照してください.

ハンズオンの事前準備について

大林氏の講演 (A1〜A3)

チュートリアルの前日までにHomCloudのインストールを済ませてください.基本的にはインストールガイドに従ってインストールしてください.最後の自己チェックプログラムを動かすところまで終われば完了です.初日の最初,チュートリアルが始まる前にインストールに関する相談会をします.前日までにインストールがうまくいかなかった人は是非参加してください.その場合はあらかじめメールでどこまでやってどのようにうまくいかなかったかを連絡するようにしてください.

ハンズオン用ファイル

以下のzipファイルにハンズオンで使うJupyter notebookのnotebookが含まれていますので,あらかじめダウンロードしておいてください.

その他注意

基本的にPythonを用いて実習するので,Pythonについてある程度は勉強してきておいてください.

鍛冶氏の講演 (B1〜B2)

スケジュール

一日目(6/18 木曜日)

    • 09:00 リモート会議場の開場/準備時間
      • インターネット会議システム等の接続確認
      • ハンズオンで用いるソフトウェアのインストール等
      • 任意参加
    • 12:00 昼食休憩
    • 13:00 開始の挨拶
    • 13:00 TDA チュートリアル#A1「パーシステントホモロジーのデータ解析への活用 」(理研AIP 大林一平)
    • 14:30 休憩
    • 14:45 TDA チュートリアル#A2(理研AIP 大林一平)
    • 15:45 コーヒーブレイク
    • 16:15 講演「パーシステントホモロジーを用いた鋼材の延性破壊過程の3次元解析」(九州大学 尾﨑由紀子)
    • 16:45 講演「トポロジカルデータ解析で材料の『かたち』を捉える」(東北大学AIMR 赤木和人)
    • 17:15 ディスカッション
    • 18:00 リモート懇親会/情報交流会(1時間半程度)

二日目(6/19 金曜日)

    • 09:00 開場/準備時間
      • インターネット会議システム等の接続確認
      • 任意参加
    • 09:30 TDA チュートリアル#A3(理研AIP 大林一平)
    • 10:30 コーヒーブレイク
    • 11:00 TDA チュートリアル#B1「Geometric toolbox for data analysis」(九州大学IMI 鍛冶静雄)
    • 12:00 昼食休憩
    • 13:30 TDA チュートリアル#B2(九州大学IMI 鍛冶静雄)
    • 14:30 休憩
    • 14:45 講演「TDAによる強磁性体磁区パターン形成過程の分析」(統計数理研究所 本武 陽一)
    • 15:15 講演「ごみとパーシステントホモロジー」(埼玉県環境科学国際センター 鈴木和将)
    • 15:45 コーヒーブレイク
    • 16:15 講演「サッカーのトラッキングデータに対するパーシステントホモロジーを用いた解析の試み」(信州大学 沼田泰英)
    • 16:45 講演「TDAによる脳波からのせん妄検出」(富士通研究所 梶谷まり)
    • 17:15 講演「Mapperを用いた企業の技術戦略の位相的データ解析」(理研AIP Emerson Escolar)
    • 17:45 閉会

アブストラクト(クリックで展開)

チュートリアル

  • 大林一平(理研AIP)「パーシステントホモロジーのデータ解析への活用 」

パーシステントホモロジーはデータの形の情報を抽出するための数学的道具で,ここ10数年理論やソフトウェア,様々なデータ解析への応用など発展が進んでいます.このチュートリアルではパーシステントホモロジーの基礎的な話から応用事例などを紹介し,演習として実際にパーシステントホモロジーによるデータ解析に挑戦してもらいます.演習では講演者が開発しているHomCloudを利用します.

  • 鍛冶静雄(九州大学IMI)「Geometric toolbox for data analysis」

データというものは有限の計算機で扱うために本質的に離散であるが,連続な対象が背後にあり、そのサンプリングとして得られている場合など,その大局的な構造を位相や幾何を通して捉えるのは往々にして有効である.このチュートリアルでは,persistent homology やラプラシアンといった道具を機械学習と組み合わせつつデータの図形的な性質を調べる方法を,実問題への応用例をあげつつ紹介する.

(2020-06-09) 資料をまとめたページ,ハンズオンではこちらのJupyter notebook(ほぼ全てGoogle Colaboratory で動きます)を使う予定です.


一般講演

  • 尾﨑由紀子(九州大学)「パーシステントホモロジーを用いた鋼材の延性破壊過程の3次元解析」

アブストラクト(PDFファイル)

  • 赤木和人(東北大学 材料科学高等研究所)「トポロジカルデータ解析で材料の『かたち』を捉える」

パーシステントホモロジーが扱う「穴」の情報は、物質材料のデータ解析でも色々と役立つことが分かってきた。本講演では、分子動力学シミュレーションで得られる大量の原子配置データからどのように「気付き」や「理解」が得られるのかを、例を挙げつつ紹介する。また、金属組織の顕微画像データを定量化してプロセス条件や物性と関係付ける逆問題アプローチについても簡単に紹介する。

  • 本武陽一(統計数理研究所)「TDAによる強磁性体磁区パターン形成過程の分析」

強磁性体は,同一磁化を持つ領域(ドメイン)の複雑な組み合わせによって構成される.このようなドメインパターンは磁区構造と呼ばれ,磁性材料の物性特性と関係することが知られている.一方で,磁区構造と物性特性が具体的にどのように関係するかについては未解明な部分が多い.

トポロジカル・データ・アナリシス(TDA)に代表される,近年の幾何的データ分析法の発展によって,複雑な物理現象を幾何的に特徴付けて理解を行う試みが行われ始めている.例えば京大・平岡らのグループは,TDAを用いてこれまで困難とされていた不規則な秩序構造を持つ相状態であるガラス相の特徴づけに成功した[Y. Hiraoka and T. Nakamura et al. PNAS(2016)].強磁性体の磁区構造もガラス状態と同様に,不規則な秩序構造をもち,その違いが物性特性と関係する.

本研究の目的は,磁区構造とその物性的特性を関係付けるパターン特徴量を,TDAと各種統計的機械学習手法を活用することで抽出することである.磁区構造形成過程データの分析の結果,磁区構造とある物性値との直接的対応付けが実現可能なことや,ある磁区構造の違いの要因となる磁区構造形成過程の機序が確認された.

  • 鈴木和将(埼玉県環境科学国際センター)「ごみとパーシステントホモロジー」

「ごみ」と「パーシステントホモロジー」一見関係なさそうな二つのもの。この二つがどのようにつながっていくのか。

ごみの研究において、埋立地から排出される汚水(浸出水)や発生ガスの量を予測し、制御するというのは埋立地の設計及び管理における最重要課題である。これら流体の流体挙動は、埋立層間隙の幾何構造と密接な関係があり、流体挙動に大きく影響しているものと考えられる。しかしながら、このような間隙の幾何構造を引き出すことは容易ではなく、間隙部分のどのような構造が流体特性を支配するのか明らかでない。そこで、本研究では、パーシステントホモロジーを用いて、間隙幾何構造と流体特性と関係について解明を試みている。本発表では、その取り組みについて紹介する。

  • 沼田泰英(信州大学)「サッカーのトラッキングデータに対するパーシステントホモロジーを用いた解析の試み」

第9回スポーツデータ解析コンペティションでは,J1リーグ戦2018年21節から25節の45試合のトラッキングデータ(各試合における各時刻での選手の位置情報)について解析を行った.このデータから,パーシステントホモロジーを用いることで,各チームにおける各選手の役割についての情報が得られるか試みた.このとき行った解析方法の概略についてお話する.

  • 梶谷まり(富士通研究所)「TDAによる脳波からのせん妄検出」

せん妄という病気は脳波で発見可能であることが知られているが、医療現場では、脳波計は大きく持ち運びや測定が大変で負担になる等の理由で使用されていない。そこで、持ち運び可能で簡単に測定可能なポータブル脳波計のデータでの解析が研究されており、周波数スペクトル解析であるBSEEG法で発見可能であることが示されている。我々は、BSEEG法を改善するため、TDAと時間遅れ埋め込みを使用して解析を行った。1患者のデータに対して、BSEEG法・TDAの特徴量それぞれで”せん妄の度合い”であるスコアを算出し、せん妄患者・非せん妄患者のデータを用いてAUCを比較した。本発表ではこれらの詳細に加え、医療現場で使用することを想定してタブレット端末での解析アプリの開発について紹介する。

  • Emerson Escolar(理研AIP)「Mapperを用いた企業の技術戦略の位相的データ解析」

Mapper解析は位相的データ解析の代表的な手法の一つであり,複雑なデータに内在する枝分かれやループといった構造を抽出して,データをMapperグラフとして可視化することができる.本研究は,Mapper解析を技術革新の分析に応用し,企業が行う研究開発活動を技術空間上で可視化する方法を提案する.具体的には,企業の(技術分野ごとの)特許取得件数の時系列データに本手法を適用してMapperグラフを構成した.得られたMapperグラフでは,フレアーと呼ぶ枝のような特徴的な構造が得られることから,それらを検出するアルゴリズムを提案した.さらに,検出したフレアーの長さは,統計的かつ経済学的な意味で企業の業績指標と有意に相関していることが分かった.

本講演は平岡裕章氏,伊神満氏,Yasin Ozcan氏と共同研究 (https://arxiv.org/abs/1909.00257) に基づく.

世話人

  • [代表] 宇田 智紀(東北大学 材料科学高等研究所)
  • 池 祐一(富士通研究所 人工知能研究所)
  • 鈴木 杏奈(東北大学 流体科学研究所)

連絡先

メールアドレス: t_uda <at_sign> tohoku.ac.jp<at_sign>@ に置き換えてください.)