#install.packages("tidyverse")
library(tidyverse)
# Carregue o arquivo csv
df = read.csv("ESCOLA_ESPANHA.csv")
# usando o tidyverse
# crie um novo data frame, apenas com nomes e sexo e notas
#ja aprendemos a fazer isso usando []
df2= df[,c("aluno","sexo","notas")]
df2= df[,c(1,2,9)]
# usando o tidyverse
df2n= select(df,aluno,sexo,notas)
# crie uma nova coluna, com o resultado da divisao das notas pelas horas de estudo
#ja aprendemos a fazer isso usando []
df$notas.hora= df$notas/df$horas.estudando
df$notas.hora= NULL
# usando o tidyverse
df= mutate(df,notas.hora = notas/horas.estudando)
df= mutate(df,notas.hora = NULL)
# crie um data frame, apenas com alunos com nota menor que 5-Reprovados
# (vamos assumir que a nota minima para ser aprovado eh 5)
#ja aprendemos a fazer isso usando []
filtro = df$notas < 5
filtro
reprovados= df[filtro,]
rep = df[df$notas < 5,]
# usando o tidyverse
rep2= filter(df, notas <5)
# selecione alunas com nota maior que oito
# filtrando
#ja aprendemos a fazer isso usando []
filtro= (df$sexo == "F" & df$notas >8)
filtro
alunas.maiores.notas= df[filtro,]
# o que eh equivalente a
alunas.maiores.notas= df[df$sexo == "F" & df$notas >8,]
# usando o tidyverse
# usando filter
alunas.maiores.notas2= filter(df, sexo == "F" & notas > 8)
# selecionando um aluno especifico
#ja aprendemos a fazer isso usando []
filtro= (df$aluno == "Matthew Pleva")
filtro
aluno.escolhido = df[filtro,]
# o que eh equivalente a
aluno = df[df$aluno == "Matthew Pleva",]
aluno2= filter(df,aluno == "Matthew Pleva")
# ja aprendemos a fazer isso usando []
df$aluno[df$aluno == "Matthew Pleva"]= "Novo Nome"
# usando o tidyverse
df= mutate(df,aluno = replace(aluno, aluno =="Matthew Pleva","Novo Nome"))
# ja aprendemos a fazer isso usando []
df$abordagem[df$abordagem == "PBL"]= "Aprendizagem baseada em projetos"
df= mutate(df,abordagem = replace(abordagem, abordagem == "PBL","Aprendizagem baseada em projetos"))
# qual a mediam mediana das notas dos alunos, qual a nota maxima e minina?
# ja aprendemos a fazer isso usando summary
estatistica = summary(df)
# usando o tidyverse
media.notas = summarise(df, media = mean(notas))
mediana.notas = summarise(df, mediana = median(notas))
max.notas = summarise(df, maxima = max(notas))
min.notas = summarise(df, minima = min(notas))
# poderiamos fazer assim
mulheres= df[df$sexo =="F",]
summary(mulheres)
# usando o tidyverse
df.agrupado= group_by(df, sexo)
notas= summarise(df.agrupado,media = mean(notas))