學生成績與多重原因分析

場景

男女學生分別來自不同地區,不同家庭收入,其成績與月發費,列表如后:

問題

    • 學生成績是否與性別相關?

    • 學生成績是否與地區相關?

    • 學生成績是否與家庭收入相關?

    • 學生成績是否與月花費相關?

    • 學生月花費是否與性別相關?

    • 學生月花費是否與地區相關?

    • 學生月花費是否與家庭收入相關?

分析

# 指定精準度 options(digits=4) # 清除殘餘變數 rm(list=ls()) # 資料整理 Score <- matrix(c(c(2,79.00, 8500.00,2,2), c(1,88.00, 4800.00,1,3), c(1,72.00, 9200.00,1,1), c(2,76.00,12000.00,1,1), c(2,85.00,15000.00,2,1), c(1,81.00, 7200.00,1,2), c(2,76.00, 6800.00,1,2), c(2,72.00, 8000.00,2,3), c(2,70.00, 9500.00,2,1), c(1,65.00, 5000.00,2,3), c(1,75.00, 6000.00,1,2), c(1,66.00, 7000.00,2,3)), ncol=5, nrow=12, byrow=T) colnames(Score) <- c('Sex', 'Score', 'Cost', 'Income', 'Location') Score <- as.data.frame(Score) # 改變資料內容 Score$Sex <- sapply(Score$Sex, switch, '1'='男', '2'='女') Score$Income <- sapply(Score$Income, switch, '1'='低收入', '2'='高收入') Score$Location <- sapply(Score$Location, switch, '1'='北部', '2'='中部', '3'='南部') # 成績分析 # 是否成績與性別有關 Score.ANOVA = aov(Score~Sex, data=Score) summary(Score.ANOVA) # 是否成績與地區有關 Score.ANOVA = aov(Score~Location, data=Score) summary(Score.ANOVA) # 是否成績與家庭收入有關 Score.ANOVA = aov(Score~Income, data=Score) summary(Score.ANOVA) # 是否成績與每月花費有關 Score.ANOVA = aov(Score~Cost, data=Score) summary(Score.ANOVA) # 是否成績與(性別,每月花費,家庭收入,及地區)有關 Score.ANOVA = aov(Score~Sex*Income*Location*Cost, data=Score) summary(Score.ANOVA) # 每月花費分析 # 是否每月花費與性別有關 Score.ANOVA = aov(Cost~Sex, data=Score) summary(Score.ANOVA) # 是否每月花費與地區有關 Score.ANOVA = aov(Cost~Location, data=Score) summary(Score.ANOVA) # 是否每月花費與家庭收入有關 Score.ANOVA = aov(Cost~Income, data=Score) summary(Score.ANOVA) # 是否每月花費與 (性別,家庭收入,地區) 有關 Score.ANOVA = aov(Cost~Sex*Location*Income, data=Score) summary(Score.ANOVA)

# 是否成績與性別有關 Df Sum Sq Mean Sq F value Pr(>F) Sex 1 10 10.1 0.19 0.67 Residuals 10 535 53.5 # 是否成績與地區有關 Df Sum Sq Mean Sq F value Pr(>F) Location 2 51 25.3 0.46 0.64 Residuals 9 494 54.9 # 是否成績與家庭收入有關 Df Sum Sq Mean Sq F value Pr(>F) Income 1 80 80.1 1.72 0.22 Residuals 10 465 46.5 # 是否成績與每月花費有關 Df Sum Sq Mean Sq F value Pr(>F) Cost 1 32 32.1 0.63 0.45 Residuals 10 513 51.3 # 是否成績與(性別,每月花費,家庭收入,及地區)有關 Df Sum Sq Mean Sq Sex 1 10.1 10.1 Income 1 112.7 112.7 Location 2 4.1 2.0 Cost 1 106.1 106.1 Sex:Income 1 134.6 134.6 Sex:Location 2 162.8 81.4 Income:Location 1 1.4 1.4 Sex:Cost 1 2.5 2.5 Income:Cost 1 10.7 10.7 # 每月花費分析 # 是否每月花費與性別有關 Df Sum Sq Mean Sq F value Pr(>F) Sex 1 35363333 35363333 5.98 0.035 * Residuals 10 59146667 5914667 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 # 是否每月花費與地區有關 Df Sum Sq Mean Sq F value Pr(>F) Location 2 62195000 31097500 8.66 0.008 ** Residuals 9 32315000 3590556 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 # 是否每月花費與家庭收入有關 Df Sum Sq Mean Sq F value Pr(>F) Income 1 4083333 4083333 0.45 0.52 Residuals 10 90426667 9042667 # 是否每月花費與 (性別,家庭收入,地區) 有關 Df Sum Sq Mean Sq F value Pr(>F) Sex 1 35363333 35363333 5.95 0.093 . Location 2 37133917 18566958 3.12 0.185 Income 1 1900083 1900083 0.32 0.611 Sex:Location 2 1621152 810576 0.14 0.878 Sex:Income 1 45801 45801 0.01 0.936 Location:Income 1 600714 600714 0.10 0.771 Residuals 3 17845000 5948333 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1