トポロジカルデータ解析を幅広い分野で活用するためのソフトウェアの使い方や機械学習への応用方法などに関する実践的なチュートリアルと,応用数学・工学・情報学分野におけるトポロジカルデータ解析の利活用事例や最先端研究に関する情報交換を目的とする分野横断型研究集会を以下の要領で実施します.
参加申し込み(必須)はこちらのフォームにご記入ください.
新型コロナウィルス感染症の影響を鑑み,本ワークショップはインターネット会議システム等を利用してリモート開催します.インターネット会議システム接続等に関する詳細は今後,参加者の皆様にメール等でご連絡する予定です.
チュートリアル講師として,理化学研究所革新知能統合研究センター トポロジカルデータ解析チーム研究員の大林一平氏と,九州大学マス・フォア・インダストリ研究所の鍛冶静雄氏をお呼びします.
大林氏はトポロジカルデータ解析による材料科学での逆解析に特化したソフトウェア&ライブラリである HomCloud
のメイン開発者であり,今回も HomCloud
の利活用方法に関するチュートリアルをしていただく予定です.
鍛冶氏はトポロジーの専門家である一方で,コンピューターグラフィックスなど様々な分野への応用を手掛けており,本チュートリアルでは機械学習でのトポロジカルデータ解析の活用などについてご講演いただく予定です.
チュートリアル講演では,TDAソフトウェアの実演や,参加者の皆さんに実際にソフトウェアを試していただく実践の時間(ハンズオン)をとる予定です.ハンズオンの準備については下記を参照してください.
チュートリアルの前日までにHomCloud
のインストールを済ませてください.基本的にはインストールガイドに従ってインストールしてください.最後の自己チェックプログラムを動かすところまで終われば完了です.初日の最初,チュートリアルが始まる前にインストールに関する相談会をします.前日までにインストールがうまくいかなかった人は是非参加してください.その場合はあらかじめメールでどこまでやってどのようにうまくいかなかったかを連絡するようにしてください.
以下のzipファイルにハンズオンで使うJupyter notebookのnotebookが含まれていますので,あらかじめダウンロードしておいてください.
基本的にPython
を用いて実習するので,Python
についてある程度は勉強してきておいてください.
一日目(6/18 木曜日)
二日目(6/19 金曜日)
パーシステントホモロジーはデータの形の情報を抽出するための数学的道具で,ここ10数年理論やソフトウェア,様々なデータ解析への応用など発展が進んでいます.このチュートリアルではパーシステントホモロジーの基礎的な話から応用事例などを紹介し,演習として実際にパーシステントホモロジーによるデータ解析に挑戦してもらいます.演習では講演者が開発しているHomCloud
を利用します.
データというものは有限の計算機で扱うために本質的に離散であるが,連続な対象が背後にあり、そのサンプリングとして得られている場合など,その大局的な構造を位相や幾何を通して捉えるのは往々にして有効である.このチュートリアルでは,persistent homology やラプラシアンといった道具を機械学習と組み合わせつつデータの図形的な性質を調べる方法を,実問題への応用例をあげつつ紹介する.
(2020-06-09) 資料をまとめたページ,ハンズオンではこちらのJupyter notebook(ほぼ全てGoogle Colaboratory で動きます)を使う予定です.
パーシステントホモロジーが扱う「穴」の情報は、物質材料のデータ解析でも色々と役立つことが分かってきた。本講演では、分子動力学シミュレーションで得られる大量の原子配置データからどのように「気付き」や「理解」が得られるのかを、例を挙げつつ紹介する。また、金属組織の顕微画像データを定量化してプロセス条件や物性と関係付ける逆問題アプローチについても簡単に紹介する。
強磁性体は,同一磁化を持つ領域(ドメイン)の複雑な組み合わせによって構成される.このようなドメインパターンは磁区構造と呼ばれ,磁性材料の物性特性と関係することが知られている.一方で,磁区構造と物性特性が具体的にどのように関係するかについては未解明な部分が多い.
トポロジカル・データ・アナリシス(TDA)に代表される,近年の幾何的データ分析法の発展によって,複雑な物理現象を幾何的に特徴付けて理解を行う試みが行われ始めている.例えば京大・平岡らのグループは,TDAを用いてこれまで困難とされていた不規則な秩序構造を持つ相状態であるガラス相の特徴づけに成功した[Y. Hiraoka and T. Nakamura et al. PNAS(2016)].強磁性体の磁区構造もガラス状態と同様に,不規則な秩序構造をもち,その違いが物性特性と関係する.
本研究の目的は,磁区構造とその物性的特性を関係付けるパターン特徴量を,TDAと各種統計的機械学習手法を活用することで抽出することである.磁区構造形成過程データの分析の結果,磁区構造とある物性値との直接的対応付けが実現可能なことや,ある磁区構造の違いの要因となる磁区構造形成過程の機序が確認された.
「ごみ」と「パーシステントホモロジー」一見関係なさそうな二つのもの。この二つがどのようにつながっていくのか。
ごみの研究において、埋立地から排出される汚水(浸出水)や発生ガスの量を予測し、制御するというのは埋立地の設計及び管理における最重要課題である。これら流体の流体挙動は、埋立層間隙の幾何構造と密接な関係があり、流体挙動に大きく影響しているものと考えられる。しかしながら、このような間隙の幾何構造を引き出すことは容易ではなく、間隙部分のどのような構造が流体特性を支配するのか明らかでない。そこで、本研究では、パーシステントホモロジーを用いて、間隙幾何構造と流体特性と関係について解明を試みている。本発表では、その取り組みについて紹介する。
第9回スポーツデータ解析コンペティションでは,J1リーグ戦2018年21節から25節の45試合のトラッキングデータ(各試合における各時刻での選手の位置情報)について解析を行った.このデータから,パーシステントホモロジーを用いることで,各チームにおける各選手の役割についての情報が得られるか試みた.このとき行った解析方法の概略についてお話する.
せん妄という病気は脳波で発見可能であることが知られているが、医療現場では、脳波計は大きく持ち運びや測定が大変で負担になる等の理由で使用されていない。そこで、持ち運び可能で簡単に測定可能なポータブル脳波計のデータでの解析が研究されており、周波数スペクトル解析であるBSEEG法で発見可能であることが示されている。我々は、BSEEG法を改善するため、TDAと時間遅れ埋め込みを使用して解析を行った。1患者のデータに対して、BSEEG法・TDAの特徴量それぞれで”せん妄の度合い”であるスコアを算出し、せん妄患者・非せん妄患者のデータを用いてAUCを比較した。本発表ではこれらの詳細に加え、医療現場で使用することを想定してタブレット端末での解析アプリの開発について紹介する。
Mapper解析は位相的データ解析の代表的な手法の一つであり,複雑なデータに内在する枝分かれやループといった構造を抽出して,データをMapperグラフとして可視化することができる.本研究は,Mapper解析を技術革新の分析に応用し,企業が行う研究開発活動を技術空間上で可視化する方法を提案する.具体的には,企業の(技術分野ごとの)特許取得件数の時系列データに本手法を適用してMapperグラフを構成した.得られたMapperグラフでは,フレアーと呼ぶ枝のような特徴的な構造が得られることから,それらを検出するアルゴリズムを提案した.さらに,検出したフレアーの長さは,統計的かつ経済学的な意味で企業の業績指標と有意に相関していることが分かった.
本講演は平岡裕章氏,伊神満氏,Yasin Ozcan氏と共同研究 (https://arxiv.org/abs/1909.00257) に基づく.
メールアドレス: t_uda <at_sign> tohoku.ac.jp
(<at_sign>
は @
に置き換えてください.)