descriptive statistics(敘述統計)
inferential statistics(推論統計)
hypothesis test(假設檢定)
references
量數
集中量數(measure of central tendency):資料集中的情形
變異量數(measure of variability):資料分散的情形
集中量數
變異量數
全距(range)
最小值(minimum):lower extreme
最大值(maximum):upper extreme
四分位數(quartile)
第一四分位數(Q1):下四分位數(lower quartile)
第二四分位數(Q2):中位數、中間值(median)
第三四分位數(Q3):上四分位數(upper quartile)
四分位距(interquartile range)(IQR)
箱形圖、箱線圖、盒鬚圖、盒式圖、盒狀圖(box plot)
平均絕對偏差(mean absolute deviation)
變異數
母體變異數(variance)
樣本變異數(sample variance)
標準差
母體標準差(standard deviation)(SD)
樣本標準差(sample standard deviation)
變異係數(coefficient of variation)(CV)
資料分布描述
峰度(kurtosis)
偏態(skewness)
68–95–99.7 rule
常態分布中的正負三個標準差
參考影片
中央極限定理(00:00–01:33)。
母體比例與樣本比例(00:00–02:56)
標準差:standard deviation (SD)
標準誤:standard error (SE) = 樣本標準差 / 樣本個數開根號
統計估計(statistical estimation)(00:00–04:54)
點估計
區間估計
母體區間估計
平均數信賴區間(大樣本)(00:00–02:21)
變異數信賴區間(00:00–03:29)
抽樣誤差與信心水準
假設
虛無假設(null hypothesis)
對立假設(alternative hypothesis)
錯誤
型一錯誤(type 1 error)
型二錯誤(type 2 error)
犯錯機率
型一錯誤機率(alpha)
型二錯誤機率(beta)
顯著水準(significance level):容許的 alpha 上限。
p 值(probability value):依現有抽樣進行推論之 alpha。
減少型一錯誤
增加接受域➔更多型二錯誤
增加樣本數➔更多抽樣成本
假設檢定
雙尾檢定(two-tailed test)
單尾檢定(one-tailed test)
左尾
右尾
高度相關不見得有因果關係:範例
參考影片