library(tidyverse)
df= read.csv("ESCOLA_ESPANHA.csv")
# ordenando
df= arrange(df, by = aluno)
# Explore o arquivo, identifique o número de alunos, turmas e professores.
summary(df)
# Questoes
# Qual o numero de meninas e meninos?
alunos.sexo = count(df, sexo)
# Qual o numero de turmas e quantos alunos por turma?
turmas = count(df, classe.ano)
# Quais foram os alunos com nota maior que oito?
maiores.que.oito= filter(df, notas >8)
# Quais sao os alunos e professores de cada turma?
turma1 = filter(df, classe.ano =="Y7A.2023")
turma2 = filter(df, classe.ano =="Y7B.2023")
turma3 = filter(df, classe.ano =="Y7C.2023")
turma4 = filter(df, classe.ano =="Y7D.2023")
#Compare a mediana das notas de todas as turmas? (faça um grafico de caixa)
p = ggplot(df, aes(x=notas, y=classe.ano))
p + geom_boxplot() + coord_flip()
p = ggplot(df, aes(x=notas, y=classe.ano, color =professor))
p + geom_boxplot() + coord_flip()
#Compare as medianas das notas de cada turma por professor? (crie um grafico de caixa)
p = ggplot(df, aes(x=notas, y=classe.ano))
p + geom_boxplot() + coord_flip() + facet_wrap(~professor)
#Compare as medianas de notas de cada turma por abordagem?(crie um grafico de caixa)
p = ggplot(df, aes(x=notas, y=classe.ano, fill =professor))
p + geom_boxplot() + coord_flip() + facet_wrap(~abordagem)
#Compare as medianas de notas de cada turma por abordagem e professor?(crie um grafico de caixa)
p = ggplot(df, aes(x=notas, y=classe.ano))
p + geom_boxplot() + coord_flip() + facet_wrap(~abordagem+professor)
# Compare as medianas de notas por pais de origem dos alunos?(crie um grafico de caixa)
p = ggplot(df, aes(x=notas, y=pais))
p + geom_boxplot() + coord_flip()
# sera que ha relacao entre notas e horas de estudo (faça um grafico de pontos?
p = ggplot(df, aes(x= horas.estudando, y= notas))
p + geom_point()
# sera que ha relacao entre notas e horas de estudo?(regressao linear)
p = ggplot(df, aes(x= horas.estudando, y= notas))
p + geom_point() +geom_smooth(method='lm')
# sera que ha relacao entre notas e horas de estudo e professor?
p = ggplot(df, aes(x= horas.estudando, y= notas))
p + geom_point() + geom_smooth(method='lm')+ facet_wrap(~professor)
# sera que ha relacao entre notas e horas de estudo e metodologia?
p = ggplot(df, aes(x= horas.estudando, y= notas, color= professor))
p + geom_point() + geom_smooth(method='lm')+ facet_wrap(~abordagem)