Interpretabilidade de modelos aplicados aos dados do ENEM

Descrição sobre o projeto com uma frase

O ENEM

Desde a última década o Exame Nacional do Ensino Médio (ENEM) ganhou destaque para alunos de todo o Brasil por ser a porta de entrada nas melhores universidades do país. Além disso, tem impacto para aqueles que almejam obter o certificado de ensino médio sem ter que cursar os três anos deste ou o supletivo para tal.

Assim como o ENADE e outras provas que avaliam a qualidade do ensino, o ENEM surgiu em 1998 com esse intuito e alunos com notas boas contribuiam para um melhor ranking das escolas pelo MEC. Após isso, sua função mudou e se tornou a principal ferramenta de ingresso no ensino superior.

Mas quais são os fatores determinantes para ser aprovado em uma universidade? A ideia aqui é realizar a análise à partir de dados socioeconômicos obtidos do ENEM e entender os principais fatores de aprovação de um aluno.

A BASE DE DADOS

A base de dados escolhida é referente aos microdados do ENEM provido pelo INEP (Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira) e disponibilizados pelo governo federal no site do ministério da educação.

Neles constam os registros anonimizados mais de 5 milhões de pessoas inscritas em 2020, as informações são oriundas do questionário preenchido pelo candidato no momento de inscrição.

São informações como:

  • Pontuação obtida em cada uma das 5 provas do exame (Redação, Ciências da Natureza, Linguagens e códigos, Ciências Humanas e Matemática);

  • Dados do participante (Faixa etária, cor/raça, sexo e etc.);

  • Características da escola do participante;

  • Questionário socio econômico.