Por Gregório Unbehaun Leal da Silva, em 15 de Agosto de 2021
Para a compreensão da análise por munícipio se faz necessário o entendimento do gráfico de boxplot.
O boxplot apresenta a distribuição dos valores de uma variável.
Por exemplo, abaixo temos listado o número de gols de determinado time* por edição do campeonato brasileiro:
gols: (66,55,66,57,54,57,59,39,59,53,44,48,46,39,59)
edição: (2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015,2016, 2017,2 018, 2019, 2020)
O boxplot organiza essa informação: veja abaixo na imagem 1:
*dados de gols reais do São Paulo Futebol Clube em campeonatos brasileiros entre 2005 e 2020
Ordenando os dados do menor para o maior:
(39, 39, 44, 46, 48, 53, 54, 55, 57, 57, 59, 59, 59, 66, 66)
39
39
44
46
48
53
54
55
57
57
59
59
59
66
66
O boxplot organiza os dados dessa forma, afim de que o leitor tenha mais facilidade de interpretar as frequências.
Tendo em base nosso exemplo acima é possível dizer que:
O menor valor é o 39
O valor que marca o primeiro quartil (o ponto 25%) é 47, bem a metade entre 46 e 48. Ou seja, 25% dos casos estão concentrados de 47 para baixo.
A mediana é 55, que é o valor central ou o segundo quartil (como são quinze valores, é o oitavo da lista). Ou seja, 50% dos casos estão concentrados em valores de 55 ou menos.
O valor que marca o terceiro quartil (o ponto 75%) é 59. Ou seja, 75% dos valores são 59 ou menos.
O maior valor é 66.
Uma análise mais completa dos itens que compõem o boxplot já foram apresentadas nesse site: clique aqui para saber mais.
Outra medida de frequência é a média. Na média somam-se todos os valores e divide-se pelo número de casos:
média = (39, 39, 44, 46, 48, 53, 54, 55, 57, 57, 59, 59, 59, 66, 66) / 15
média = 53,4
Tendo em vista esses conceitos, vamos agora analisar uma medida o quanto cada "grupo político" perdeu por munícipio.
Utilizando o exemplo anterior, ao invés de gols falaremos de diferença de votação (em 2018 menos em 2014) e ao invés de edição do campeonato será o munícipio.
Ou seja, ao invés de 15 casos, teremos 28, que equivale ao número de munícipios no Alto Vale.
Os grupos políticos avaliados serão os mesmos da parte um: Milton Hobus, PT, MDB.
Uma vez avaliados os boxplots desses três grupos será apresentada a comparação desses com o boxplot da direita "não-miltista".
E por fim, vamos gerar regressões logísticas binárias e simulações (a parte mais inovadora dessa análise).
No que se segue nas imagens 2,3 e 4, reporta-se:
a distribuição boxplot de Milton, PT e MDB;
a cidade em que mais houve aumento em cada um dos três;
a cidade em que mais houve queda;
e os percentuais de Ituporanga e Rio do Sul, os munícipios mais populosos da região.
A linha verde representa zero (sem oscilação). O que mais se ressalta dos três boxplots é que a maioria dos casos se concentra abaixo dessa linha. Portanto, houve quedas significativas nos três.
Na votação de Milton Hobus, Trombudo Central foi aquela em que ocorreu mais queda de votação de 2018 comparado à 2014. Queda de 76%.
Em apenas 5 dos 28 munícipios - Rio do Campo, Vidal Ramos, Santa Terezinha, Witmarsum e Chapadão do Lageado - Hobus teve oscilação positiva
Os dados do boxplot mostram a seguinte formatação:
O primeiro quartil encontrado foi: -56,98%
A mediana: -47,98%
A média: -26,51%
O terceiro quartil: -18,99%
Chapadão do Lageado é um exemplo de outlier de Limite Superior, um valor discrepante, que não segue a estrutura mais padronizada dos valores.
O limite de detecção de outliers é construído utilizando o intervalo interquartílico, dado pela distância entre o primeiro e o terceiro quartil. Sendo assim, os limites inferior e superior de detecção de outlier são dados por:
Limite Inferior = Primeiro Quartil – 1,5 * (Terceiro Quartil – Primeiro Quartil)
Limite Superior = Terceiro Quartil + 1,5 * (Terceiro Quartil – Primeiro Quartil)
O crescimento do PT em Presidente Getúlio é outro exemplo de outlier, pode ser que seja fruto da força do jovem político Leonardo Pavanello Junior. Entretanto, a a regra é a redução da votação no partido de 2018 em comparação com 2014. Os dois munícipios mais populosos da região são exemplos disso.
Em apenas 5 dos 28 munícipios - Lauretino, Ibirama, Presidente Getúlio, Witmarsum e José Boiteux - o PT teve oscilação positiva.
Os dados do boxplot mostram a seguinte formatação:
O primeiro quartil encontrado foi: -61,60 %
A mediana: -39,35 %
A média: -17,84 %
O terceiro quartil: -9,45 %
Também é visível a oscilação negativa da maior parte dos munícipios da região para o "velho" MDB. Entretanto, cumpre ressaltar, que essa queda é menos acentuada do que nos casos de Hobus e PT. Em Rio do Sul, foram 7% de oscilação negativa. Na capital da cebola, foram 34%.
É emblemático o caso de Trombudo Central, onde a queda da votação de Milton reportada acima é acompanhada pelo crescimento do MDB no munícipio (+ 136%). A força da legenda na cidade, simbolizada em Geovana Gessner, talvez tenha alguma relação com esse fato.
Em apenas 5 dos 28 munícipios - Presidente Nereu, José Boiteux, Atalanta, Rio do Campo, Trombudo Central - o MDB teve oscilação positiva
Os dados do boxplot mostram a seguinte formatação:
O primeiro quartil encontrado foi: -31,46 %
A mediana: -15,97 %
A média: - 9,71 %
O terceiro quartil: -5,03 %
Percebe-se que na maior parte dos munícipios, as três forças políticas mais "tradicionais" tiveram oscilação negativa. Na busca de entender os determinantes do voto na região deve-se observar a imagem 5, apresentada abaixo. Nessa, apresenta-se juntos 4 boxplots, os mesmos três apresentados acima e o do agrupamento de partidos chamado aqui de direita "não-militsta":
O que já havia sido apontado na parte 1 dessa análise em relação ao total da região é também visível nessa imagem. A oscilação positiva é "regra" entre a votação dos partidos apontados como "direita não-militsta".
A imagem 6 apresenta uma comparação gráfica
O aumento em 26 dos 28 munícipios é forte quando comparado aos outros três "grupos" políticos mais tradicionais.
Dado que temos 28 valores de uma variável de aumento percentual é possível tentar rodar regressões para tentar compreender os determinantes do voto no alto vale. Dado a natureza dos poucos dados disponíveis, entretanto não foi possível rodar uma regressão linear.
É possível, entretanto, por se menos exigente, executar uma variável de regressão logística binária. Para isso basta transformar a variável de aumento percentual em binária, sendo 1 pro caso do grupo/partido/candidato no munícipio ter tido maior votação e 0 para decréscimo. Assim é possível verificar o efeito de MDB, PT ou Hobus contra a categoria de referência: direita “não-miltista”.
Os resultados da regressão constam abaixo nas tabela 1 e imagem 7:
Uma primeira observação é que a categoria referência da análise é a direita "não-miltista". Cumpre destacar, que cada um dos valores é comparado a essa categoria. Os asteriscos ao lado dos números indicam significância estatística. Isso quer dizer na prática que podemos avaliar a informação do odds-ratio.
A partir de odds-ratio, reportado na tabela 1, é possível aplicar a fórmula:
‘percentual = (odds-ratio -1)*100’,
Logo (-0,02-1)*100 = -98%.
Ou seja, ser do MDB ou Milton Hobus implica em chance de 98% de que vai haver oscilação negativa em um munícipio hipótetico do Alto Vale. Para o PT a chance é de 99%
A imagem 7 mostra a plotagem dos efeitos, distante da linha tracejada zero (portanto, estatisticamente significante) e com efeitos negativos (estão à esquerda do zero).
O R2 de TJUR mostra bom potencial de explicação, de 45%. Ou seja, somente com uma variável conseguimos explicar quase metade da expressiva votação da direita "não-miltista".
E se dispuséssemos de mais dados? Infelizmente não dispomos e não é possível investigar os outros 55%. Mas é possível aumentar a capacidade explicativa do modelo. Para isso os avanços da computação nos são úteis. O pacote 'Zelig', utilizado nesse site em análises futebolísticas, permite testar as probabilidades efetuando mil simulações para verificar em quantas delas cada um das "forças políticas" obteria oscilação positiva em um munícipio hipotético do Alto Vale.
Nas mil vezes que o programa simulou a regressão, em 186 Milton Hobus conseguiu oscilação positiva em algum município
155 em mil ocasiões. A simulação petista foi ainda pior.
Na simulação "pelega" somente em 18,63% das vezes houve oscilação positiva.
Em 91,25 % das vezes, a simulação gerou oscilação positiva.
A seguir, na parte 3, o leitor é contemplado com uma comparação da votação de Aécio Neves e Jair Bolsonaro nos 28 munícipios do Alto Vale. A inovação é a utilização de estatística bayesiana através do método de Monte Carlo.
Gostou? Compartilhe