Por Gregório Unbehaun Leal da Silva, 15 de Agosto de 2021
Segundo pesquisa recente, Jair Bolsonaro segue forte em Santa Catarina, estado que lhe deu maior votação em 2018.
Nessa pesquisa, entre 44,6% e 47,5% declaram voto nele em um eventual pleito no Vale Itajaí, região que comporta o Alto Vale. O foco aqui é estudar o fenômeno do bolsonarismo no Alto Vale.
Usei para essa análise dados eleitorais oficiais dos pleitos de 2014 e de 2018.
A alternativa usada para esse estudo foi comparar as votações de segundo turno de candidatos antipetistas nos dois últimos pleitos presidenciais. A comparação de Aécio Neves em 2014 e Bolsonaro em 2018, no Alto Vale é o foco do que se segue.
A principal inovação dessa parte é a utilização de estatística bayesiana com o método Monte Carlo. Há uma boa previsão da votação em Bolsonaro, tendo como informação o antipetismo prévio e o tamanho do eleitorado de cada cidade.
A análise se inicia com a imagem 1, que compara as votações totais dos dois candidatos antipetistas em 2014 e em 2018.
A imagem 1 traz a comparação para toda a região em votos totais:
Aécio Neves em 2014 recebeu 113.715 votos, já Bolsonaro em 18, recebeu 141.837. São 28.122 votos de crescimento antipetista em todo Alto Vale.
Isso se traduz em votos válidos : Neves recebeu 64,83% e Bolsonaro 82,42%
Na sequência vemos o boxplot (a mesma ferramenta utilizada na segunda parte dessa análise) da porcentagem de votos válidos em Aécio Neves e Bolsonaro por munícipio (imagem 2). Também se irá apresentar o boxplot da diferença entre porcentagem de votos válidos em Bolsonaro – porcentagem de votos válidos em Aécio (imagem 3).
Em três cidades, Aécio Neves perdeu para Dilma Roussef (Vitor Meireles, Vidal Ramos e Imbuia). Jair Bolsonaro ganhou em todos
A maior votação de Neves foi em Braço do Trombudo: 74,42 %. Esse valor está abaixo da média de votação por munícipio de Bolsonaro.
A maior votação em Bolsonaro também foi em Braço do Trombudo: 87,73%
A média de votação por município de Aécio foi de cerca de 61%, a de Bolsonaro 79%.
A menor votação de Neves foi em Vitor Meirelles: 48,3%
A menor votação de Bolsonaro foi em José Boiteux: 67,8%
O primeiro quartil para voto em Bolsonaro foi de 75,8%, o de Neves foi de 57,19%
O terceiro quartil para voto em Bolsonaro foi de 83,48%, o de Neves foi de 66,07%
Em Rio do Sul, o antipetismo já era forte, pois foi a cidade em que a diferença entre Aécio e Bolsonaro foi menor, só 9,68%.
Já em Vidal Ramos, o antipetismo cresceu cerca de 26,81%. Em Imbuia, o crescimento foi de 26,74%.
Os dados eleitorais disponíveis para essa análise são parcos em conteúdo, tenta-se extrair ao máximo algo deles. Uma alternativa é a correlação de Pearson. Os coeficientes de correlação são métodos estatísticos para se medir as relações entre variáveis e o que elas representam.
O coeficiente de correlação de Pearson (r), também chamado de correlação linear ou r de Pearson, é um grau de relação entre duas variáveis quantitativas e exprime o grau de correlação através de valores situados entre -1 e 1.
Quando o coeficiente de correlação se aproxima de 1, nota-se um aumento no valor de uma variável quando a outra também aumenta, ou seja, há uma relação linear positiva. Quando o coeficiente se aproxima de -1, também é possível dizer que as variáveis são correlacionadas, mas nesse caso quando o valor de uma variável aumenta o da outra diminui. Isso é o que é chamado de correlação negativa ou inversa.
Um coeficiente de correlação próximo de zero indica que não há relação entre as duas variáveis, e quanto mais eles se aproximam de 1 ou -1, mais forte é a relação.
Saiba mais em https://operdata.com.br/blog/coeficientes-de-correlacao/
A correlação de Pearson mede as correlações entre duas variáveis numéricas (ou seja, votos)
Conseguiremos mensurar a correlação de Pearson em 3 testes:
Correlação % votos válidos em Aécio e % votos válidos em Bolsonaro
Correlação votos válidos totais e votos válidos em % votos válidos em Aécio, para testar se o tamanho do eleitorado teve algum efeito
Correlação votos válidos totais e votos válidos em % votos válidos em Bolsonaro, para testar se o tamanho do eleitorado teve algum efeito
A correlação de 0,76 é alta. Isso indica que utilizar a votação em Aécio é um bom preditivo para a votação em Bolsonaro. Ou seja, é esperado que um dado munícipio com maior votação em Aécio, também tenha maior votação em Bolsonaro, o oposto também é verdadeiro.
Para realizar os testes 2 e 3 teste foi necessário transformar em logaritmo, os votos válidos.
Por que fazer isso?
Supondo que a distribuição da variável em questão possui um viés (no nosso caso, a população de Rio do Sul é muito maior que o resto da região), ou seja, uma das extremidades elevadas e uma cauda longa, medidas como correlação ou regressão podem ser bastante influenciadas pelo pico da distribuição, outliers, dentre outros. A aplicação da transformação pode reduzir o efeito do viés.
Saiba mais em: http://rstudio-pubs-static.s3.amazonaws.com/289147_99e32d5403f942339c3fe05414ac62fd.html
O interesse dos testes 2 e 3 é que é possível testar se o tamanho da cidade interfere na votação do candidato antipetista. Uma vez que ambos os pleitos o candidato do PT tem maior votação em municípios menores.
Fontes:
https://veja.abril.com.br/politica/voto-petista-resiste-em-municipios-pequenos-no-interior-do-pais/
Tendo em base essa tendência nacional têm-se duas hipóteses:
H1 - É de se esperar uma correlação positiva, ou seja quanto maior a cidade mais votos no candidato antipetista.
A comparação entre os valores dos testes também é útil, aquele que tiver correlação menor tem menos efeito do tamanho da cidade:
H2 – Espera-se que, dado o espalhamento maior do bolsonarismo conforme dados apontados acima(imagem 1), que o efeito do tamanho da cidade seja menor para Bolsonaro 2018 do que para Neves 2014.
Os dois resultados são maiores que 0 e portanto, positivos. Logo, a hipótese 1 se mostrou verdadeira. O mesmo se pode dizer a respeito da hipótese 2, já a que a correlação para voto em Bolsonaro é menor, ou seja, menos dependente do tamanho da cidade, do que na votação de Aécio.
Para voto em Bolsonaro, o que seria mais relevante: o tamanho da cidade e o comportamento eleitoral prévio antipetista? O modelo de regressão linear testa essa dimensão. O modelo tem a seguinte fórmula:
Y = a +B1 + B2 + e
Sendo que ‘y’ é nossa variável dependente que é percentual de votos válidos em em Bolsonaro 2018 no Alto Vale. Já ‘a’ é o intercepto, cujo análise não cabe aqui. (Saiba mais sobre o intercepto - clique aqui)
‘B1’ e ‘B2’ são variáveis explicativas do modelo. A primeira refere-se ao comportamento antipetista prévio aqui apontado como voto em Aécio em 2014. A segunda variável explicativa é o tamanho do eleitorado logaritimizado. O ‘e’ refere-se ao termo de erro, que é a parte que o modelo não explica, pode ser o gênero, a renda, a raça, a escolaridade, entre outros. Como não dispomos desses dados, nosso modelo tem capacidade preditiva limitada.
Mas, como veremos a seguir, o termo de erro representa cerca de 45%, ou seja, só B1 e B2 representam 55% de capacidade preditiva. O que é muito considerando que estamos falando de um estudo eleitoral.
Observa-se no modelo reportado acima que tanto tamanho do eleitorado em 2018, quanto voto em Aécio são positivamente correlacionados para explicar o voto em Bolsonaro. No entanto, só o voto em Aécio é estatisticamente significativo (os 3 asteriscos ao lado). Isso quer dizer que a cada 1% de votação em Aécio em 2014, o modelo preve 0,59% de votação a mais em Bolsonaro em 2018.
A imagem do lado direito plota os coeficientes, embora não seja significativo, o tamanho da cidade tem sentido positivo, ou seja quanto maior a cidade, mais chance de votação em Aécio. É provável que a inclusão de mais cidades no modelo faria com que essa variável ganhasse significância estatística. As duas informações não surpreendem, haja visto o teste 1, bem como a comprovação da hipótese 2.
O R2 ajustado apontado é de 0,55, essa medida é de 0 a 1, ou seja o modelo tem poder preditivo de 55%.
Chegamos a parte mais inovadora dessa análise. Para reforçar os nossos achados, podemos utilizar o método de Monte Carlo:
A técnica foi usada pela primeira vez por cientistas que trabalharam na bomba atômica; foi nomeado para Monte Carlo, a cidade turística de Mônaco conhecida por seus cassinos.
Desde sua introdução na Segunda Guerra Mundial, a simulação de Monte Carlo tem sido usada para modelar uma variedade de sistemas físicos e conceituais.
O método de Monte Carlo tem muito a ver com o campo da estatística que por si só é muito útil para avaliar suas chances de ganhar ou perder em um jogo de azar, como a roleta, qualquer coisa que envolva jogar dados, tirar cartas, etc., que podem ser vistos como processos aleatórios.
O nome é, portanto, bastante apropriado, pois captura o sabor do que o método faz.
Saiba mais em: https://www.portalsaofrancisco.com.br/matematica/metodo-de-monte-carlo)
Monte Carlo é uma técnica bayesiana (saiba mais em: https://www.ibpad.com.br/blog/o-que-e-estatistica-bayesiana/). Nos será útil para prever o desempenho a votação de Bolsonaro tendo em base o tamanho do eleitorado e a votação de Aécio Neves em 2014.
Para que o leitor compreenda melhor, vamos exemplificar com o caso de Rio do Sul:
Os votos válidos de 2014 em Rio do Sul foram 38,170, isso dá em valores logaritimizados = 10.549805
Já a porcentagem de votos válidos em Aécio na cidade em 2014 foi de 73,26%
Tendo em base esses dois valores, o método Monte Carlo pode prever a votação em Bolsonaro e comparar com o dado real. No software estatístico utilizado para minhas análises o software R, há um pacote de estatística bayesiana o “Bas”. Esse pacote permite que eu faça a previsão. Eis a fórmula
library(BAS)
modelbas<-bas.lm(Bolsonaro2018 ~ Neves14 + log_valid2014,data=base2, prior="ZS-null", modelprior = uniform(), method = "MCMC")
rsl <- data.frame(Neves14 = 0.7326, log_votos18 = 10.549805)
pred = predict(modelbas, newdata = rsl, estimator = "BPM", se.fit=T)
pred$fit
O resultado deu 86,47 %. Já que a votação de 2018 já ocorreu, eu posso comparar minha previsão com o dado real. A votação de 82,94% é relativamente próxima à previsão.
Convém lembrar que só com poucas informações consegui prever a exatidão do voto em Rio do Sul com menos de 4% de diferença. Imagine se mais dados me fossem disponíveis? Poder-se-ia prever com mais exatidão ainda.
A comparação entre as previsões com o método Monte Carlo para os 28 municípios para voto em Bolsonaro, seguindo a mesma estratégia feita com os dados de Rio do Sul, constam na imagem 8 abaixo:
Em 18 dos 28 municipios a previsão se aproximou em pelo menos 3%
José Boiteux foi o maior erro, com o modelo prevendo 9% a mais de votação para Bolsonaro.
A melhor previsão se deu em Salete (0,29% de diferença)
Em 6 cidades, a previsão se aproximou do dado real em menos de 1% de diferença
À primeira vista, os municípios em que Aécio recebeu menor votação, são os que erraram mais a previsão. Por serem cidades menos antipetistas e acabaram sendo mais afetadas pela surpreendente onda bolsonarista de 2018. Nas outras cidades, o antipetismo já era mais consolidado e o bolsonarismo nem precisou “fazer tanta força”.
Para concluir, uma última comparação:
A onda bolsonarista foi muito forte em todo o Brasil, Bolsonaro no país recebeu 6,77% a mais do Aécio Neves. Como era de se esperar, em Santa Catarina, o bolsonarismo é mais forte e continua sê-lo. Em especial no Alto Vale, a força do movimento bolsonarista se mostrou mais consolidada. 17,65% a mais de votação no Alto Vale, recebeu Jair Bolsonaro do que Aécio Neves.
Os efeitos dessa votação, suspeito, reverberaram para muito além do voto presidencial. Como busquei demonstrar ao longo de toda a análise ( partes 1 e 2 ) e na análise sobre o voto em Rio do Sul, as forças políticas mais tradicionais, mesmo as alinhadas à direita, foram fortemente afetadas por esse fenômeno. Ouso prever, que o bolsonarismo siga "incomodando" em 2022 no Alto Vale.
Observação: Aqueles que desejam ter acesso aos bancos criados e scripts de análises, favor entrem em contato.
VEJA TAMBÉM: Como se sairá Bolsonaro em 2022 no Alto Vale?
Gostou? Compartilhe