(covariance)
特性
單位:視隨機變數而不同
範圍:-∞ ≤ covariance ≤ +∞
不易比較
關係判斷
零:無線性共變
正:正向線性共變
負:負向線性共變
Microsoft Excel 對應函式
資料分析➔共變數(視為母體)
母體(舊版):COVAR(array1, array2)
母體(新版):COVARIANCE.P(array1, array2)
樣本(新版):COVARIANCE.S(array1, array2)
LibreOffice 對應函式
Data➔Statistics➔Covariance
Google Sheets 對應函式
母體:COVAR(data_y, data_x)
樣本:COVARIANCE.S(data_y, data_x)
參考影片
(Pearson product-moment correlation coefficient)
特性
單位:無
範圍:-1 ≤ r ≤ +1
易於比較
關係判斷
零:無線性相關
正:正向線性相關
負:負向線性相關
高度相關不見得有因果關係:範例
Microsoft Excel 對應函式
LibreOffice 對應函式
Data➔Statistics➔Correlation
Google Sheets 對應函式
參考影片
相關係數(11:49–13:10)
(simple regression analysis)
變數
自變數(independent variable):為連續型
一個:簡單迴歸
多個:複迴歸
因變數(dependent variable):僅有一個
離散型:邏輯迴歸(logistic regression)類別問題
連續型:線性迴歸(linear regression)數值問題
估計法
最大概似法(maximum likelihood method)(ML)
普通最小平方法(ordinary least square method)(OLS)
總變異量(total variation):sum of the squares total (SST)
已解釋變異量(explained variation):sum of squares due to regression (SSR)
未解釋變異量(unexplained variation):sum of the squared error (SSE)
判定係數(coefficient of determination):SSR 佔 SST 之比例。(軟體中通常顯示為「R 的平方」)
線性:適用於簡單線性資料集的最適直線。
多項式:適合波動不定的資料。惟不宜太多次方,以免過於複雜。
對數:資料的增減速率一開始非常快,後來又趨於平緩。
乘冪:適用於表示以特定比率增加的比較值。
指數:適用於驟增或驟減的資料值。
選擇依據
資料符合:愈複雜的迴歸線愈會符合樣本資料。
理論吻合:愈簡單的迴歸線愈會吻合理論推測。
解釋便利:愈簡單的迴歸線愈易於說明與應用。
抽樣變動:愈簡單的迴歸線每次抽樣變動愈小。
經濟效益:排除難以取得的自變數以節省成本。
(multiple regression analysis)
變數
自變數(independent variable):為連續型
一個:簡單迴歸
多個:複迴歸
因變數(dependent variable):僅有一個
離散型:邏輯迴歸(logistic regression)類別問題
連續型:線性迴歸(linear regression)數值問題
選擇依據
每個自變數與因變數相關係數:高
每個自變數彼此之間相關係數:低
每個自變數彼此之間交互作用:不顯著(參考雙因子變異數分析)
Microsoft Excel 對應函式
LibreOffice 對應函式
Data➔Statistics➔Regression
Google Sheets 對應函式
LINEST(known_data_y, [known_data_x, b, verbose])
參考影片