install.packages("car")
library(car)
Prestige
row.names(Prestige)
attach(Prestige)
1) Geben Sie den Mittelwert, den Median und die Standardabweichung des mittleren Einkommens (income) über alle Berufe an
# Aufgabe 1
mean(income)
median(income)
sd(income)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
install.packages("car")
library(car)
Prestige
row.names(Prestige)
1) Geben Sie den Mittelwert, den Median und die Standardabweichung des mittleren Einkommens (income) über alle Berufe an
install.packages("car")
library(car)
Prestige
row.names(Prestige)
attach(Prestige)
# Aufgabe 1
mean(income)
median(income)
sd(income)
# Aufgabe 2
cor(x=income,y=women)
cor.test(income,women)
## Je höher das Einkommen der Berufsgruppe, desto geringer der Frauenanteil
# Aufgabe 3
income_bc <- income[which(type=="bc")]
income_wc <- income[which(type=="wc")]
# Als Welch-Test unter der Annahme ungleicher Varianzen
t.test(income_bc,income_wc)
t.test(income_bc,income_wc,alternative="two.sided",mu=0,paired=FALSE,var.equal=FALSE)
# Als t-Test
t.test(income_bc,income_wc,alternative="two.sided",mu=0,paired=FALSE,var.equal=TRUE)
## das mittlere Einkommen unterscheidet sich bei einer Irrtumswahrscheinlichkeit von 5%
# nicht signifikant zwischen Arbeitern und Angestellten
# Aufgabe 4
## Man kann die Datentabelle ordnen ->
row.names(Prestige)[order(prestige,decreasing = T)]
## physicians haben das höchste Prestige
## zweiter Ansatz
berufe <- row.names(Prestige)
summary(prestige)
which(prestige==87.2)
berufe[24]
## dritter Ansatz
row.names(Prestige)[which.max(prestige)]
# Aufgabe 5
summary(
lm(formula = prestige ~ income + education, data = Prestige)
)
## Fast 80% der Varianz der AV (Prestige) kann mithilfe der beiden Faktoren
#Einkommen und Ausbildungszeit vorhergesagt werden. Sehr hoch!
# Aufgabe 6
## ANOVA: UV: type, AV: prestige
summary(
aov(formula=prestige~type,data = Prestige)
)
### das mittlere Prestige unterscheidet sich signifikant zwischen den
### drei definierten Berufsgruppen
# Aufgabe 7
## Chi-Quadrat-Test
beruf_klasse <- ifelse(women >=50, "Männerberuf", "Frauenberuf")
table(beruf_klasse)
chisq.test(x=table(beruf_klasse),p=c(.5,.5))
## Hypothese abgelehnt.
## Annahme, dass die Hälfte aller Berufe Frauenberufe sind wird
## verworfen
# Aufgabe 8
table(beruf_klasse,type)
chisq.test(table(beruf_klasse,type))
## Es gibt einen Zusammenhang zwischen den Variablen