社会知能情報学基礎1
副題: データサイエンティストへの招待
時間: 月曜1限(9:00〜10:30)
場所: 電気通信大学 西10棟111
講師:西山悠
TA: 山本美紀, 加藤嘉浩, Sébastien Louvigné (セバスチャン)
お知らせ
以下に講義計画があります (update 6/24).
Rを使って授業を行います.各自ノートパソコンを持参ください.
出来る方は授業前にRをダウンロード・インストールしておいてください.
講義内容
Rを使った確率・統計の授業(入門者向け).
samuraiシステムを使った他人のレポートの査読(peer-review).
講義目標
確率・統計の基礎を習得する.
統計ソフトRを使う事ができる.
興味あるデータの統計解析ができる.
専門知識を使い適切に査読(専門的アドバイス)ができる.
評価方法
出席50%+レポート課題(数回)50%
講義計画
4/13 ガイダンス, Rインストール, 事前テスト(確率・統計基礎), アンケート(知識観, 目標指向性)
4/20 1変数の記述統計 (平均値, 中央値, 最頻値, 分位点, 標本分散, 不偏分散, 標準偏差, 歪度, 尖度, 要約統計量, データ視覚化, ヒストグラム, 箱ひげ図, etc), samurai使用説明
4/27 演習1 (samurai: ルーブリック作成 -> closed-end課題upload (5/10〆切) -> 自己評価)
5/4 休講(GW)
5/11 samuraiを利用した査読1 (samurai: グループルーブリック作成 -> 相互評価 -> closed-end課題修正upload (5/17〆切))
5/18 2変数の記述統計 (散布図, 相関, 共分散, 相関係数, 共分散行列, 相関行列, 対称行列, 正定値行列, クロス集計表 etc) 事(前)後アンケート(知識観, 目標指向性)
5/25 演習2 (samurai: グループルーブリック修正 ->closed-end課題upload (5/31〆切) -> 自己評価)
6/1 samuraiを利用した査読2 (samurai: 相互評価 -> closed-end課題修正upload (6/14〆切))
6/8 推測統計, 様々な確率分布 (パラメトリックモデル, ノンパラメトリックモデル, 指数型分布族, 確率変数, 確率質量関数pmf, 確率密度関数pdf, 累積分布関数cdf, ベルヌーイ分布, 二項分布, 多項分布, ポアソン分布, 1次元正規(ガウス)分布, 多次元正規(ガウス)分布, ガンマ分布, ガンマ関数, 指数分布, カイ2乗分布, F分布, ベータ分布, ベータ関数, ディリクレ分布, student's t分布, コーシ分布, カーネル密度推定/Parzen window, etc)
6/15 推測統計 (母集団, 標本, 推定量, 標本分布, 一致推定量, 不偏推定量, 最尤推定, 事後分布(ベイズの定理), 最大事後確率(MAP)推定, スコア関数, フィッシャー情報量, クラーメル-ラオの下限, 有効推定量, etc), 理解度確認+事前テスト, アンケート(知識観, 目標指向性)
6/22 統計的仮説検定 (背理法, 帰無仮説, 対立仮説, 有意水準, 第1種の誤り, 危険率, 検定統計量, 棄却域, p値, 平均値検定, 分散値検定, 無相関検定, 独立性検定(カイ2乗検定), T検定, F検定, Welch検定)
6/29 演習3 (最終課題) (samurai: ルーブリック作成 -> open-end課題upload (7/12〆切) -> 自己評価)
7/6 演習3 (最終課題)
7/13 samuraiを利用した査読3 (samurai: グループルーブリック作成 -> 相互評価 -> open-end課題修正upload (7/26〆切))
7/20 休講 (海の日)
7/27 アンケート & 理解度確認テスト & 発表者選出
8/3 プレゼン発表(演習3)
主な参考書
山田 剛史,杉澤武俊,村井潤一郎,Rによるやさしい統計学,オーム社,2008
他の参考文献
小暮厚之, Rによる統計データ分析入門, 朝倉書店, 2009
辻谷 將明, 和田 武夫, Rで学ぶ確率・統計, オーム社, 2012
秋山裕,Rによる計量経済学,オーム社,2009
内田 治, 西澤英子, Rによる統計的検定と推定, オーム社, 2012
加藤健太郎, 山田剛史, 川端一光,Rによる項目反応理論, オーム社, 2014
新納 浩幸,Rで学ぶクラスタ解析, オーム社, 2007