StatsML Symposium'20 - プログラム

プログラム

プログラムは随時更新します．

講演日程・タイトル・アブストラクト

＝＝＝＝＝＝＝＝

12/3（木）

＝＝＝＝＝＝＝＝

----------------------------------------------------------------------------------------

Session 1-1（13:10 - 14:30）

座長：梅津佑太（長崎大学）

----------------------------------------------------------------------------------------

寺田吉壱（大阪大学） [抄録]

講演タイトル：大規模なクラスタリングにおける計算量削減法について

アブストラクト：

近年，データの大規模化・複雑化に伴い，探索的なデータ解析の中でも教師なし学習の重要性が再認識されている．一方で，クラスタリング法において，大規模なデータに対しては計算コストの低いk-means法のような単純な方法の適用が主流であり，データの背後のクラスタ構造を十分に捉えることができていない可能性がある．本発表では，様々なクラスタリング法に対して用いることのできる汎用的な計算量削減法を開発し, その性質について議論する.

黒木祐子（東京大学） [抄録] [スライド]

講演タイトル：限られた観測に基づく確率的組合せバンディット問題

アブストラクト：

組合せバンディット問題とは逐次的意思決定問題の一つであり，不確実性を伴う組合せ最適化とも密接に関わっている．本講演では組合せバンディット問題を概観し，講演者が行なってきた「限られた観測しか得られない設定」についての最新の研究成果を紹介する．最短経路問題をはじめとした様々な組合せ最適化問題を扱うバンディット問題の定式化を行い，提案アルゴリズムの標本複雑度とその最適性について議論する．

-------------------------------------------------

Session 1-2（15:00 - 16:20）

座長：岩澤有祐（東京大学）

-------------------------------------------------

横田達也（名古屋工業大学） [抄録]

講演タイトル：信号処理と機械学習による画像復元

アブストラクト：

本講演ではノイズ，欠損，ボケ，ダウンサンプルなどで情報を失った劣化画像から原画像を復元する技術について紹介する．画像復元の手法は大きく信号処理的アプローチと機械学習的アプローチに分けられる．両者のメリットとデメリットについて議論し，最近の研究としてPULSE [Menon+, 2020], Deep Image Prior [Ulyanov+, 2018], 高階埋め込み多様体モデル [Yokota+, 2019]について紹介し，今後の課題について考える．

幡谷龍一郎（東京大学） [抄録] [スライド]

講演タイトル：深層学習を支えるデータ拡張

アブストラクト：

深層学習は画像認識や自然言語処理をはじめとする各分野で飛躍的な性能向上をもたらしており，身の回りの様々なサービスにも応用されている．一方，深層学習は多量の学習データを必要とするという課題が存在する．データ拡張は学習データを実質的に増量することで性能向上につなげる方法で，データ量が限られるときにも有効なことが知られている．本講演ではデータ拡張の最近のトレンドを，講演者の研究を交えながら紹介する．

-------------------------------------------------

Session 1-3（16:50 - 18:00）

特別講演

座長：梅津佑太（長崎大学）

-------------------------------------------------

福水健次（統計数理研究所/Preferred Networks）[スライド]

講演タイトル：深層生成モデルの理論と応用

アブストラクト：

敵対的生成ネットワーク（GAN）や変分オートエンコーダといった深層生成モデルは，新しいデータ生成モデルとして活発に研究されており，画像の生成タスクにとどまらず，確率モデルによる学習・推論におけるサンプリング手法としても展開を見せている．本講演では，講演者の関連する研究として，GAN学習の安定化手法に関する理論的解析や，生成モデルを用いたモデル比較による因果方向の学習に関する研究について述べる．

＝＝＝＝＝＝＝＝

12/4（金）

＝＝＝＝＝＝＝＝

-------------------------------------------------

Session 2-1（10:30 - 12:00）

企画講演 : 海外で活躍する若手研究者に迫る

座長：松井孝太（名古屋大学）

-------------------------------------------------

Koichiro Shiba（Harvard T.H. Chan School of Public Health） [抄録]

講演タイトル：疫学研究における因果推論と機械学習：応用研究者の立場から事例紹介

アブストラクト：

統計的因果推論における機械学習アルゴリズムの応用への注目が近年高まっている。すでに開発された手法が具体的にどのような課題の解決に役立つのか、講演者が実際に取り組んでいる疫学研究における応用例を手法「ユーザー」の立場から紹介する。また海外留学の経験についても簡単に触れる。

-------------------------------------------------

Session 2-2（13:30 - 14:50）

座長：寺田吉壱（大阪大学）

-------------------------------------------------

菅澤翔之助（東京大学） [抄録] [スライド]

講演タイトル：異質な集団が混在するデータに対する統計モデリング

アブストラクト：異質な集団が混在するデータに対する有効な統計モデリングの重要性は個別化医療やターゲットマーケティングなどの様々な分野で認知されている。本発表ではデータのグループ化（分割）と各グループごとの統計モデリングを同時に実行することが可能な方法論を提案する。さらに提案手法を推定するためのアルゴリズムた理論的性質について議論し、数値実験やデータ解析の例を通して提案手法の有用性について紹介する。

竹野思温（名古屋工業大学） [抄録] [スライド]

講演タイトル：出力空間の情報量を用いたベイズ最適化とその発展

アブストラクト：

観測に高いコストのかかるブラックボックス関数の最適化は非常に重要な問題である. ベイズ最適化はこの問題に有効な手法として知られており, データの獲得とベイズモデルの更新を繰り返すことで効率的な最適化を実現する. 本発表では, 性能と計算の容易さから注目されている, 出力空間の情報量に基づいてデータを獲得する手法を紹介する. さらに, 実応用上重要ないくつかの問題に自然に拡張できることを示す.

-------------------------------------------------

Session 2-3（15:20 - 16:40）

座長：横田達也（名古屋工業大学）

-------------------------------------------------

岩澤有祐（東京大学） [抄録]

講演タイトル：敵対的学習による表現の制御技術とその応用

アブストラクト：

データから有用な表現を学習する深層学習は，画像やテキストをはじめ多様な領域で予測精度を向上させることが報告されている．一方，公平性やプライバシーなどの観点への配慮が必要な場面，あるい交絡因子が存在する場面では，学習される表現が特定の情報を持たないことが望ましい場合がある．本講演では，ニューラルネットが学習する表現が特定の情報に依存しないように制約する方法とその応用・改良について，講演者の研究を交えて紹介する．

野沢健人（東京大学） [抄録] [スライド] [動画]

講演タイトル：Introduction of PAC-Bayes and its Application for Contrastive Unsupervised Representation Learning

アブストラクト：

PAC-Bayes理論は、機械学習アルゴリズムの汎化について解析する一般的な枠組みである。PAC-Bayes理論の概要を紹介し、その応用例として、contrastive unsupervised representation learning の汎化誤差の上界と得られた上界の最小化アルゴリズムについて報告する。

-------------------------------------------------

懇親会（18:00 - ）

進行：梅津佑太（長崎大学），松井孝太（名古屋大学）

-------------------------------------------------

企画講演2（18:10-18:40）Ph.D.取得者は海外でどのようなキャリアパスをとり得るのか

米倉頌人（千葉大学）

講演タイトル：若き統計学者の英国

＝＝＝＝＝＝＝＝

12/5（土）

＝＝＝＝＝＝＝＝

-------------------------------------------------

Session 3-1（10:00 - 11:30）

チュートリアル講演

座長：松井孝太（名古屋大学）

-------------------------------------------------

富谷昭夫（理研BNL）[スライド]

講演タイトル：理論物理学における機械学習の応用

アブストラクト：

近年の機械学習の進展により、様々な理論物理学分野に機械学習が応用され始めている。

本講演では、素粒子論物理学を中心として、様々応用例を紹介する。また近年の応用例から学ぶ

次の時代にどのような取り組みが必要であるかも議論する。

-------------------------------------------------

Session 3-2（13:00 - 14:20）

座長：松井孝太（名古屋大学）

-------------------------------------------------

林祐輔（Japan Digital Design） [抄録] [スライド]

講演タイトル：機械学習の情報熱力学

アブストラクト：

統計・機械学習と熱力学との間には様々なかたちで形式的アナロジーが成り立つことが知られている．しかし，なぜそのようなアナロジーが成り立つのかということについては，未だ十分な答えが得られたとは言い難い状況にある．本講演では，まず最初に統計・機械学習と物理学の間に成り立つ形式的アナロジーについて概説した後，こうしたアナロジーを基礎づける物理モデルを提案する．具体的には，データと統計モデルのパラメータを量子状態の組としてあらわしたとき，統計的学習がそれらの組に対する熱力学的フィードバック操作として捉えられることを明らかにする．これにより，統計・機械学習が本質的に熱力学の対象として捉えられることを示す．

林直輝（NTTデータ数理システム/東京工業大学） [抄録] [スライド] [動画]

講演タイトル：パラメータ制約付き行列分解のベイズ汎化誤差解析

アブストラクト：

正則でない統計モデルのベイズ汎化誤差を解析するための数学的基礎（特異学習理論）が構築され，行列分解のベイズ汎化誤差を司る学習係数（実対数閾値）は完全に解明されている．しかしパラメータ空間に制約条件が付いた場合については明らかにされていない．本研究ではパラメータ制約付きモデルの代表として非負値行列分解（NMF）と潜在ディリクレ配分（LDA）を対象とし，それらのベイズ汎化誤差に対する理論解析を実施する．

-------------------------------------------------

Session 3-3（14:50 - 16:10）

座長：林祐輔（Japan Digital Design 株式会社）

-------------------------------------------------

篠崎智大（東京理科大学） [抄録] [スライド]

講演タイトル：臨床試験と因果モデル

アブストラクト：

因果推論と機械学習とのクロスオーバーは現在最も議論の活発なトピックの一つである。統計的因果推論側からは従来統計モデルが用いられてきた部分を機械学習モデルで代替した柔軟な推測が、機械学習側からは最先端の手法を反事実予測に応用し推論の射程を広げることが目的とされることが多い。本講演では特に臨床試験を題材として、実在性と識別性の観点からいくつかの因果モデルを解説し、応用を目指す研究者に因果推論の少し突っ込んだランドスケープを紹介したい。

齋藤優太（東京工業大学/半熟仮想） [抄録] [スライド]

講演タイトル：Large-scale Open Dataset, Pipeline, and Benchmark for Off-Policy Evaluation

アブストラクト：

機械学習の一つの活用方法に、意思決定の自動化・高性能化が挙げられる。オフ方策評価 (Off-Policy Evaluation)は、機械学習などによって構成される意思決定方策の性能を、別の方策によって蓄積されたログデータのみを用いて評価するための技術である。本発表では、オフ方策評価の基礎について解説する。また、オフ方策評価の現実的で再現可能な実験評価や実務現場における容易な実装を可能にするための実データ公開及びソフトウェア開発を含むオープンソースプロジェクトについて紹介する。