授業概要:
ビッグデータ時代の到来とともに,データサイエンティストには、統計的因果推論と機械学習の両方の知識が問われる場が増えてきています。本授業では、統計分析ソフトR(2020年度以前は、STATA)を利用し、様々な形状のデータを分析しながら、統計的因果推論の基礎を学んだ後、機械学習や深層学習といった技術が、どのようにデータの分析に使えるかを学びます。毎週、実際のデータを用いて、様々な手法を1つ1つ自分の手で実行しながら学んで行きます。
教科書:
マット・タディ(2020) 「ビジネスデータサイエンスの教科書」すばる舎
授業計画:
1. Rの基礎I(Introduction to R Programming I)
2.Rの基礎II(Introduction to R Programming II)
3.Rの基礎III(Introduction to R Programming III)
4.単回帰分析 (Bivariate Regression)
5.重回帰分析 I (Multiple Regression I)
6.重回帰分析 II (Multiple Regression II)
7.時系列分析(Time Series Analysis)
8.パネルデータ分析 (Panel Data Analysis)
9.双子研究(Twin Study)
10.操作変数法 (Instrumental Variable)
11.実験と擬似実験 (Experiments and Quasi-Experiments)
12.機械学習 I (Machine Learning I) :リサンプリング法、モデル選択、正則化
13.機械学習 II (Machine Learning II): 決定の木と樹木モデル
14.機械学習 III (Machine Learning II): 次元削減-クラスタリングと主成分分析
15.おわりに (Wrap Up)