A primeira competição de análise de dados do Nordeste no formato de gincana visa a interação do conhecimento estatístico entre os alunos e professores e profissionais do nordeste de forma descontraída . As questões propostas serão sobre análise exploratória de dados. Os participantes terão acesso ao software R e a internet para elaborar suas respostas com mais habilidade e criatividade.
Bruno Santos : Departamento de Estatística da UFBA
Julio Trecenti : Instituto de Matemática e Estatística de São Paulo
Gilênio Borges : Departamento de Estatística da UFBA
Os dados que serão utilizados na primeira edição da competição foram obtidos a partir do Instituto Brasileiro de Geografia e Estatística (IBGE) que correspondem a Pesquisa Nacional por Amostra de Domicílios - PNAD de 2015. A PNAD é encarregada em investigar anualmente, de forma permanente, características gerais da população, de educação, trabalho, rendimento, habitação e outras. Nesta edição foram selecionadas algumas variáveis de tal forma que os competidores não tenham dificuldades em responder as perguntas formuladas pela comissão avaliadora.
Os dados podem ser carregados no software R (https://www.r-project.org/) com os seguintes comandos.
#...................................................................................................................................................................
library(dplyr)
dados <- tbl_df(read.csv("https://brsantos.github.io/arquivos/dadosResumo_PNAD2015.csv"))
#.....................................................................................................................................................................
Para mais informação dos dados dar click aqui.
A comissão decidiu disponibilizar aos competidores um Script que permite transformar as variáveis categóricas do banco de dados em fatores. O Script está disponibilizado nas versões Windows e Linux nos endereços a seguir:
Windows
source("https://brsantos.github.io/arquivos/NiveisVariaveis_win.R")
Linux
source("https://brsantos.github.io/arquivos/NiveisVariaveis.R")