城市犯罪分析

場景

警政署蒐集台灣 10 縣犯罪 (竊盜 殺人 強盜搶奪) 統計資料,資料如后:

縣市 竊盜 殺人 強盜搶奪 1 臺 北 縣 81.22 0.22 1.54 2 宜 蘭 縣 59.60 0.45 1.55 3 桃 園 縣 75.32 0.27 1.50 4 新 竹 縣 64.34 0.53 1.19 5 苗 栗 縣 63.12 0.38 1.08 6 臺 中 縣 75.68 0.15 1.05 7 彰 化 縣 59.71 0.30 1.32 8 南 投 縣 58.72 0.29 1.43 9 雲 林 縣 66.91 0.40 1.27 10 嘉 義 縣 44.87 0.30 0.93

犯罪分析

# 指定精準度 options(digits=4) # 清除殘餘變數 rm(list=ls()) # 擴充敘述統計函數功能 Summary <- function(data, col) { p <- summary(data[, col]) p['StdVar'] <- sd(data[, col]) p } # 主成分分析 doPCA <- function(dataset, formula) { PCA.Analysis <- prcomp(formula, data=dataset, center=TRUE, scale=TRUE) PCA.Analysis } # 載入資料 DataPath <- '/Users/RichCLee/Documents' PCA.Data <- read.table(paste(DataPath, 'PCA-4.csv', sep='/'), header=T, , sep=',') # 敘述統計 for (i in 2:5) { print(colnames(PCA.Data)[i]) print(Summary(PCA.Data, i)) } # 使用所有變數進行分析 q <- doPCA(PCA.Data, ~竊盜+殺人+強盜搶奪) q # 合併圖 par(mfrow=c(1, 2), pty='s') # 繪製陡坡量圖 plot(q, type="line", main="陡坡圖") # 特徵值 > 1 者即為應選擇因子 print(q$sdev^2) # 繪製因素負荷量圖 biplot(q, choices=c(1, 2), main='因素負荷量圖') # 主成分分析 summary(q)

竊盜 Min. 1st Qu. Median Mean 3rd Qu. Max. StdVar 44.9 59.6 63.7 64.9 73.2 81.2 10.5 殺人 Min. 1st Qu. Median Mean 3rd Qu. Max. StdVar 0.1500 0.2750 0.3000 0.3290 0.3950 0.5300 0.1122 強盜搶奪 Min. 1st Qu. Median Mean 3rd Qu. Max. StdVar 0.9300 1.1100 1.3000 1.2900 1.4800 1.5500 0.2202

Standard deviations: [1] 1.2483 1.0148 0.6419 Rotation: PC1 PC2 PC3 竊盜 0.7162 0.0058 0.6979 殺人 -0.4622 -0.7453 0.4806 強盜搶奪 0.5229 -0.6667 -0.5311

Importance of components: PC1 PC2 PC3 Standard deviation 1.248 1.015 0.642 Proportion of Variance 0.519 0.343 0.137 Cumulative Proportion 0.519 0.863 1.000 前二項成分可解釋變異量:0.863