Código fonte do Desafio 4

# Carregue o arquivo csv

df = read.csv("ESCOLA_ESPANHA.csv")

# Qual o tipo de dados do arquivo?

class(df)

is.data.frame(df)

# Note que data frame eh um tipo especial de list

# onde cada elemento tem o mesmo tamanho

typeof(df)

# Explore o data frame, veja suas caracteristica

View(df)

summary(df)

# O data frame tem quantas linhas e colunas?

linhas= nrow(df)

colunas= ncol(df)

# ha algum valor nao disponivel no data frame?

is.na(df)

anyNA(df)

# qual o nome das colunas?

nomes.colunas= colnames(df)

# qual o nome das linhas?

nomes.linhas= rownames(df)

# qual a mediana das notas dos alunos, qual a nota maxima e minina?

summary(df)

# mostre as primeiras linhas do data frame

head(df)

# mostre as ultimas linhas do data frame

tail(df)

# vamos selecionar colunas do data frame

# crie um novo data frame, apenas com nomes e sexo e notas

df2= df[,c("aluno","sexo","notas")]

# segunda forma de fazer isso

df3= df[,c(1,2,9)]

# vamos selecionar linhas do data frame

# selecione as linhas 1, 3 e 5 do data frame original

df4= df[c(1,3,5),]

is.data.frame(df4)

# DICA:

# se voce selecionar apenas uma coluna do data frame o resultado eh um vetor!!!

df5= df[,1]

is.data.frame(df5)

str(df5)

DF5= as.data.frame(df5)

is.data.frame(DF5)

# para evitar esse problema used drop= F

df6= df[,1, drop= F]

is.data.frame(df6)

str(df5)

# crie uma nova coluna, com o resultado da divisao das notas pelas horas de estudo

df$notas.hora= df$notas/df$horas.estudando

# remova a coluna que voce acabou de criar

df$notas.hora = NULL

# crie um data frame, apenas com alunos com nota menor que 5-Reprovados

# (vamos assumir que a nota minima para ser aprovado eh 5)

filtro = df$notas < 5

filtro

reprovados= df[filtro,]

# selecione alunas com nota maior que oito

# filtrando

filtro= (df$sexo == "F" & df$notas >8)

filtro

alunas.maiores.notas= df[filtro,]

# o que eh equivalente a

alunas.maiores.notas= df[df$sexo == "F" & df$notas >8,]

# selecionando um aluno especifico

filtro= (df$aluno == "Smaly Ha")

filtro

aluno.escolhido = df[filtro,]

# o que eh equivalente a

aluno = df[df$aluno == "Smaly Ha",]

# dica:extra

df$aluno[df$aluno == "Smaly Ha"]= "Erica Ha"

Erica = df[df$aluno == "Erica Ha",]

df$abordagem[df$abordagem == "PBL"]= "Aprendizagem baseada em projetos"

Page updated

Google Sites

Report abuse