Overview
<Reference>
久保拓弥 (2012). 『データ解析のための統計モデリング入門―一般化線形モデル・階層ベイズモデル・MCMC』 東京:岩波書店.
講義のページへようこそ (2023/9/20)
3-1. 幾何分布
7-1. 離散一様分布
8-1. 連続一様分布
<Reference>
統計の時間:https://bellcurve.jp/statistics/course/ (2023/10/19)
Overview
Likelihood estimation
ある確率分布から与えられたデータをもとにもとの確率分布を点推定する。
性質
漸近性(データが多いと真の値に近づく → データが少ないとズレやすい)
Bayse estimation
最尤推定するときに、データに偏りがあったら、真の値から結構ズレない?
→ 事前情報を加えよう!
性質
データが少なくても、真の値に近づく → 事前情報の信頼性が重要
<Reference>
Non-linear method
UMAP
サイン距離および相関距離などの距離指標が使用できる
クラスタのサイズ(密度的な意味)も残したまま可視化 --->>> DensMAP
t-SNE (ティースニー)
It follows student's t-distribution.
Isomap
https://alechelbling.com/UnderstandingIsomap/
Linear method
MDS (for non-parametric data)
PCS (for parametric data)
Issues:
異なるデータを低次元上でも遠くに保つことに焦点を当てたアルゴリズムのため、類似しているデータを低次元上でも近くに保つことには弱い
特に高次元上の非線形的なデータに対しては「類似しているデータを低次元上でも近くに保つこと」は不可能に近い
<Reference>