順天堂大学健康データサイエンス学部の学生に向けた本研究室の紹介ページです。
本研究室は、学部生のモチベーションごとに2つのコースを用意しています。
コース1)本格的に修士や博士を見据えて、統計的機械学習や因果推論等の統計学分野の研究に取り組みたいと考えている人
3年生の配属段階で、統計検定2級レベルの知識を要求します。4年生の9月までを目処に数理統計学の教科書を1冊きちんと読み切り、論文1本を背景知識を含めて精読できて、シミュレーション実験の再現実験が行えるレベルを目指します。また、教科書を読み切った後は、大学院生向けの教科書を進めていき、修士を終える頃には、対外的な発表や論文の執筆ができるレベルを目指します。
コース2)4年生の卒業後は民間企業で働くことを想定し、データの分析の経験を積みたい人
3年生の終わりまでに統計検定2級に合格することをまず目標にします。その上で、大学4年生は外部で実施されているデータ分析コンペティションへ出場します。現在は、スポーツデータ解析コンペ、マーケティングデータ分析コンペなどを想定していますが、自分が参加してみたいコンペに出場し、データを集め、分析して発表を行います。
配属時点の準備(目安)
9月の段階で、統計検定2級相当の基礎力を目標にしてください。
ゼミ(毎週60~120分)
9月〜1月:『現代数理統計学の基礎(久保川 著)』を輪読し、主要概念と計算手法を整理します。
目標:確率分布、期待値・分散、統計的推論/検定、漸近論など、論文を読むための“言語”を揃えること
秋学期:関連授業(保健衛生データ解析/健康医療統計学 等)も活用し、論文精読と発表の基礎を作ります。
論文探索(12月末〜3月)
主要統計学術誌(例:Annals of Statistics, JASA, Biometrika, JRSS-B)や JMLR などから、興味あるテーマの論文を探します。
1〜3月のゼミで、候補論文の要点を資料にまとめて発表します。
目標:研究テーマ設定の第一歩として「何が新規で、何が課題か」を言語化すること
個別ミーティング(原則:1名あたり週最大60分)
春休みに選んだ論文を軸に、以下の段階で精読・再現・検証を進めます。
理解:手法の中核アイデアと数式の流れを説明できる(背景知識も含める)
適用範囲の把握:どんな目的で、どんなデータに、どの分野で使われるかを説明できる
再現:論文のシミュレーション(実験)を再現するコードを書ける
比較・検証:既存手法との比較実験を設計し、結果の差を解釈できる
限界の分析:どんなときにうまくいかないか(失敗条件)を具体的に議論できる
例:シミュレーション設定に依存する性能劣化
例:パラメータ選択・チューニングの難しさ
見つけた課題を改善する方法の提案
提案手法と既存手法の比較実験による有効性の検証
プログラミング言語:R / Python
Git/Github
LaTex (Overleaf 環境)
North Carolina State University : https://www.lib.ncsu.edu/formats/teaching-and-learning-datasets
Causal Inference : A Statistical Learning Approach (by Stefan Wager) : https://web.stanford.edu/~swager/causal_inf_book.pdf
Machine Learning and Causal Inference (by Susan Athey and Stefan Wager) : https://web.stanford.edu/~swager/teaching.html
Machine Learning Theory (by Hirshberg) : https://machine-learning-theory.github.io/
Dive into Deep Learning : https://d2l.ai/chapter_appendix-mathematics-for-deep-learning/information-theory.html
関西大学 黒川先生 行動経済学 : https://sites.google.com/site/hirofumikurokawa/zemi
東北大学 石垣先生 統計学・マーケティング: https://www2.econ.tohoku.ac.jp/~isgk/lecture.html
神戸大学 末石先生 https://sites.google.com/site/naoyasueishij/teaching
神戸大学 分寺先生 https://www2.kobe-u.ac.jp/~bunji/files/lecture/MVA/html/
A gentle introduction to matrix calculas : https://www.sciencedirect.com/science/article/pii/S0304407624002070