# Carregue o arquivo csv
df = read.csv("ESCOLA_ESPANHA.csv")
# Qual o tipo de dados do arquivo?
class(df)
is.data.frame(df)
# Note que data frame eh um tipo especial de list
# onde cada elemento tem o mesmo tamanho
typeof(df)
# Explore o data frame, veja suas caracteristica
View(df)
summary(df)
# O data frame tem quantas linhas e colunas?
linhas= nrow(df)
colunas= ncol(df)
# ha algum valor nao disponivel no data frame?
is.na(df)
anyNA(df)
# qual o nome das colunas?
nomes.colunas= colnames(df)
# qual o nome das linhas?
nomes.linhas= rownames(df)
# qual a mediana das notas dos alunos, qual a nota maxima e minina?
summary(df)
# mostre as primeiras linhas do data frame
head(df)
# mostre as ultimas linhas do data frame
tail(df)
# vamos selecionar colunas do data frame
# crie um novo data frame, apenas com nomes e sexo e notas
df2= df[,c("aluno","sexo","notas")]
# segunda forma de fazer isso
df3= df[,c(1,2,9)]
# vamos selecionar linhas do data frame
# selecione as linhas 1, 3 e 5 do data frame original
df4= df[c(1,3,5),]
is.data.frame(df4)
# DICA:
# se voce selecionar apenas uma coluna do data frame o resultado eh um vetor!!!
df5= df[,1]
is.data.frame(df5)
str(df5)
DF5= as.data.frame(df5)
is.data.frame(DF5)
# para evitar esse problema used drop= F
df6= df[,1, drop= F]
is.data.frame(df6)
str(df5)
# crie uma nova coluna, com o resultado da divisao das notas pelas horas de estudo
df$notas.hora= df$notas/df$horas.estudando
# remova a coluna que voce acabou de criar
df$notas.hora = NULL
# crie um data frame, apenas com alunos com nota menor que 5-Reprovados
# (vamos assumir que a nota minima para ser aprovado eh 5)
filtro = df$notas < 5
filtro
reprovados= df[filtro,]
# selecione alunas com nota maior que oito
# filtrando
filtro= (df$sexo == "F" & df$notas >8)
filtro
alunas.maiores.notas= df[filtro,]
# o que eh equivalente a
alunas.maiores.notas= df[df$sexo == "F" & df$notas >8,]
# selecionando um aluno especifico
filtro= (df$aluno == "Smaly Ha")
filtro
aluno.escolhido = df[filtro,]
# o que eh equivalente a
aluno = df[df$aluno == "Smaly Ha",]
# dica:extra
df$aluno[df$aluno == "Smaly Ha"]= "Erica Ha"
Erica = df[df$aluno == "Erica Ha",]
df$abordagem[df$abordagem == "PBL"]= "Aprendizagem baseada em projetos"