Data frames: instalando o pacote tidyverse (1 min. 54 seg.)
Manipulando Data frames com o pacote "tidyverse" : funções filter (4 min. 1 seg.)
Manipulando Data frames com o pacote "tidyverse" : funções select (5 min. 28 seg.)
Manipulando Data frames com o pacote "tidyverse" : funções mutate e transmute (5 min. 2 seg.)
Manipulando Data frames com o pacote "tidyverse" : funções arrange, group e summarize (8 min. 25 seg.)
Manipulando Data frames com o pacote "tidyverse": função sample (3 min. 33 seg.)
Manipulando Data frames com o pacote "tidyverse": função pipe %>% (4 min. 14 seg.)
Manipulando Data frames com o pacote "tidyverse": funções gather e spread (3 min. 56 seg.)
Manipulando Data frames com o pacote "tidyverse": função separate ( 2 min 43 seg)
Manipulando Data frames com o pacote "tidyverse": função unite ( 2 min 30 seg)
Aplicação prática: usando o R para facilitar a importação de uma lista de contatos (Gmail)
Desafio:
Neste desafio você irá aprender a extrair informações de um data frame, usando usando funções do pacote "tidyverse" .
O arquivo fornecido é totalmente fictício, os nomes foram gerados usando um gerador de nomes aleatórios. Qualquer semelhança com nomes de pessoas reais é mera coincidência.
Faça download do arquivo : "ESCOLA_ESPANHA.csv" ( ele está disponível aqui)
Carregue este arquivo no R Studio
Crie um novo data frame, contendo apenas informações sobre nomes, sexo e notas (usando a função select)
Crie uma nova coluna, com o resultado da divisão das notas pelas horas de estudo ( usando a função mutate)
Remova a coluna que você acabou de criar do data frame ( usando a função mutate)
Crie um data frame, apenas com alunos com os aluno(a)s reprovados ( nota menor que 5) ( usando a função filter)
Crie um data frame apenas com as alunas com nota maior que oito ( usando a função filter)
Selecione todas as informações do aluno "Matthew Pleva" ( usando a função filter)
Troque o nome do aluno "Matthew Pleva" por "Novo Nome" ( usando a função mutate combinada com a função replace )
Troque o nome "PBL" por "Aprendizagem baseada em projetos" em todo o data frame ( usando a função mutate combinada com a função replace )
Qual a media e a mediana das notas de todos os alunos? qual a maior nota e qual a menor nota? (usando a função summarise)
Qual a media das notas apenas das meninas? (use as funções group and summarise)
Criando um gráfico de pontos, camada por camada, usando o ggplot2 (13 min 04 seg)
Criando um histograma, usando o ggplot2 (6 min 24 seg)
Criando um gráfico de barras, usando o ggplot2 (12 min 19 seg)
Criando um gráfico de caixa, usando o ggplot2 (6 min 58 seg)
Mudando a aparência do gráfico criado ( tipo de ponto, formato, etc.) (6 min 11 seg)
Desafio:
Neste desafio você irá aprender a extrair informações de um data frame, por meio de gráficos.
Você terá que fazer uso de algumas funções simples que eu não ensinei em aulas anteriores. Como dica eu dou o nome delas. Porém você terá que pesquisar por conta própria como usá-las.
O arquivo fornecido é totalmente fictício, os nomes foram gerados usando um gerador de nomes aleatórios. Qualquer semelhança com nomes de pessoas reais é mera coincidência.
Neste exercícios vamos fazer algumas análises de desempenho de alunos de uma escola internacional, a International School of Spain .
Os alunos são oriundos de diversos países . Estaremos comparando notas de alunos do sétimo ano de 2023, de turmas diferentes que estão cursando a disciplina Matemática. Cada turma tem um professor, e cada professor segue abordagens de ensino e aprendizagem diferentes. Queremos explorar os dados, de modo a extrair informações importantes. Para tal faremos um estudo exploratório.
Faça download do arquivo : "ESCOLA_ESPANHA.csv" ( ele está disponível aqui)
Carregue este arquivo no R Studio.
Ordene o arquivo, por ordem alfabética dos alunos ( dica: use a função arrange )
Explore o arquivo, identifique o número de alunos, turmas e professores.
Qual o numero de meninas e meninos? ( dica: use a função count )
Qual o numero de turmas e quantos alunos por turma?
Quanto e quais foram os alunos com nota maior que oito?
Crie quatro data frames, um para cada turma
Compare a mediana das notas de todas as turmas? (dica: faça um gráfico de caixa). Qual foi a turma com maior mediana das notas?
Alguns professores usam a abordagem de ensino e aprendizagem baseada em projetos (PBL). Outros usam aulas expositivas, centradas no professor. Compare as notas dos alunos, por turma e por abordagem . Será que alguma das abordagens tem levado a resultados superiores, em termos de notas?(dica: faça um gráfico de caixa).
Os alunos são oriundos de países diferentes. Será que a formação que o aluno teve em seu país de origem impacta nas notas? Compare as notas dos alunos, por país .(dica: faça um gráfico de caixa).
Os alunos estudam após as aulas na biblioteca. O sistema da biblioteca registra a entrada e saída dos alunos e os alunos indicam a disciplina que estudaram. Portanto a escola tem uma estimativa razoável do número de horas que cada aluno estudou Matemática. A estimativa de horas que cada aluno estudou Matemática constam no arquivo fornecido (variável horas.estudando). Será que há uma correlação entre o número de horas que cada aluno estudo e a nota obtida? (dica: crie um gráfico de pontos.)
Será que a dedicação dos alunos os alunos ao estudo tem alguma relação com o professor? (dica: crie um gráfico de pontos, comparando as notas das turmas e horas de estudo, separando pelos professores.)
Ou será que a abordagem de ensino tem alguma relação com o notas?