I - Competição de Análise de Dados (I - CAD) do Nordeste

A primeira competição de análise de dados do Nordeste no formato de gincana visa a interação do conhecimento estatístico entre os alunos e professores e profissionais do nordeste de forma descontraída . As questões propostas serão sobre análise exploratória de dados. Os participantes terão acesso ao software R e a internet para elaborar suas respostas com mais habilidade e criatividade.

Regras

  1. As equipes devem estar compostas por no máximo 5 integrantes.
  2. Pelo menos um dos membros da equipe deve ter cursado a disciplina de Modelos de Regressão
  3. A equipe deve escolher um nome, da área de estatística, que os caracterize.
  4. No dia da competição a equipe deve levar consigo um notebook e/ou materiais de consulta.
  5. Pós-graduandos, professores e profissionais participarão da competição como moderadores ou monitores de cada equipe (inscrição individual)

Critérios

  1. Criatividade na apresentação dos resultados
  2. Habilidade no manuseio do software R
  3. Agilidade na obtenção os resultados

Examinadores

Bruno Santos : Departamento de Estatística da UFBA

Julio Trecenti : Instituto de Matemática e Estatística de São Paulo

Gilênio Borges : Departamento de Estatística da UFBA

Dados

Os dados que serão utilizados na primeira edição da competição foram obtidos a partir do Instituto Brasileiro de Geografia e Estatística (IBGE) que correspondem a Pesquisa Nacional por Amostra de Domicílios - PNAD de 2015. A PNAD é encarregada em investigar anualmente, de forma permanente, características gerais da população, de educação, trabalho, rendimento, habitação e outras. Nesta edição foram selecionadas algumas variáveis de tal forma que os competidores não tenham dificuldades em responder as perguntas formuladas pela comissão avaliadora.

Os dados podem ser carregados no software R (https://www.r-project.org/) com os seguintes comandos.

#...................................................................................................................................................................

library(dplyr)

dados <- tbl_df(read.csv("https://brsantos.github.io/arquivos/dadosResumo_PNAD2015.csv"))

#.....................................................................................................................................................................

Para mais informação dos dados dar click aqui.

A comissão decidiu disponibilizar aos competidores um Script que permite transformar as variáveis categóricas do banco de dados em fatores. O Script está disponibilizado nas versões Windows e Linux nos endereços a seguir:

Windows

source("https://brsantos.github.io/arquivos/NiveisVariaveis_win.R")

Linux

source("https://brsantos.github.io/arquivos/NiveisVariaveis.R")