Ah, a Estatística! A palavra que pode fazer o coração de muitos tremer e os olhos lacrimejarem apenas ao imaginar gráficos e fórmulas complexas. Mas não tema! Hoje vamos desmistificar um dos conceitos mais temidos dessa área: o desvio padrão.
Vamos começar com a fórmula para entender como o desvio padrão é calculado e por que ele é importante. A fórmula para calcular o desvio padrão é:
Mas calma, não se assuste com a fórmula! Em vez de nos perdermos em cálculos matemáticos, vamos visualizar isso de uma forma mais intuitiva.
Para nos ajudar a entender o desvio padrão, vamos usar um conjunto de dados reais. Estamos trabalhando com dados de votos por seções eleitorais em Rio do Sul, SC, para deputado estadual. Temos a distribuição de votos classificados em quatro categorias políticas:
Esquerda: Inclui votos em candidatos de partidos como PCO, PC do B, PDT, PSB, PSOL, PSTU, PT e REDE.
Centro: Inclui PSDB, MDB, PV, SOLIDARIEDADE e CIDADANIA.
Direita: Inclui AVANTE, DC, NOVO, PATRIOTA, PL, PODE, PP, PROS, PRTB, PSC, PSD, PTB, REPUBLICANOS e UNIÃO BRASIL.
Branco/Nulo: Inclui votos em branco e nulos.
Para facilitar a compreensão, começaremos (Figura 1) com gráficos que mostram a distribuição de votos por categoria política, sem incluir o desvio padrão. Esses gráficos mostram a distribuição geral dos votos para cada uma das quatro categorias mencionadas.
Na segunda parte (Figura 2), apresentaremos gráficos semelhantes, mas agora com a adição das linhas de desvio padrão. Aqui, você verá a distribuição dos votos com a média marcada e as linhas indicando um desvio padrão acima e abaixo da média. Isso permitirá visualizar a variação dos votos dentro de cada categoria.
Finalmente, na terceira parte (Figura 3), faremos uma comparação direta. Juntaremos os gráficos das categorias Esquerda, Centro e Branco/Nulo em uma única linha para facilitar a comparação visual entre elas. Isso ajudará a identificar semelhanças e diferenças nas distribuições das categorias políticas em relação ao desvio padrão.
Prepare-se para ver como o desvio padrão pode oferecer insights valiosos sobre a variabilidade dos dados e como ele pode ser interpretado visualmente através dos gráficos. Vamos embarcar nessa jornada pela Estatística, e prometo que não será tão assustadora quanto você imagina!
Figura 1 - Distribuição comparada. Observe como é difícil identificar qual é maior entre Esquerda, Centro e Branco/Nulo.
Figura 2 - Com Desvio Padrão (1 para baixo e 1 para cima por categoria); A média é representada pela linha preta tracejada, e o desvio padrão (-1 e +1) é indicado pela linha vermelha.
Figura 3 - Comparação da Distribuição dos Votos nas Categorias 'Esquerda', 'Centro' e 'Branco/Nulo' (excluindo Direita devido ao volume significativamente maior de votos) – O gráfico vai até 40, pois essas três categorias não possuem dados acima desse valor.
Que tal adicionar mais um desvio padrão para cima e para baixo na análise? Essa abordagem é útil porque permite expandir a compreensão da distribuição dos dados além dos intervalos mais comuns. Ao incluir um desvio padrão adicional, você pode visualizar melhor a dispersão dos dados e identificar padrões ou discrepâncias que não são tão evidentes em intervalos menores. Essa visão mais ampla proporciona uma compreensão mais detalhada da variabilidade dos dados e ajuda a interpretar a concentração e a dispersão com maior precisão.
O Que Significa Estar Dentro de um Intervalo de Desvio Padrão?
Os desvios padrão fornecem uma medida da dispersão dos dados em torno da média. Aqui está o que significa estar dentro dos intervalos de desvio padrão:
Intervalo de -1 a 1 Desvio Padrão: Aproximadamente 68% dos dados caem dentro de um intervalo de um desvio padrão acima e abaixo da média. Isso significa que se você pegar um valor aleatório de seus dados, há uma alta probabilidade (cerca de 68%) de que ele estará dentro desse intervalo. No gráfico, esse intervalo é representado por linhas vermelhas e indica onde a maior parte dos dados está concentrada.
Intervalo de -2 a 2 Desvios Padrão: Aproximadamente 95% dos dados caem dentro de um intervalo de dois desvios padrão acima e abaixo da média. Isso indica que a grande maioria dos dados está concentrada dentro desse intervalo mais amplo. No gráfico, esse intervalo é representado por linhas azuis e mostra um alcance mais amplo onde a maioria dos dados se encontra.
Interpretação Visual nos Gráficos
Nos próximos dois gráficos, você verá essas proporções claramente representadas:
Primeiro Gráfico (Figura 4): Mostrará a distribuição dos votos com o intervalo de dois desvios padrão (da média -2 a 2 desvios padrão). A figura também incluirá a comparação com o intervalo de um desvio padrão. Nota-se como a votação nos partidos de 'Esquerda' na cidade está mal distribuída (ou seja, há algumas seções que votam muito mais do que a média e outras que votam muito menos do que a média). Nas duas outras categorias do gráfico ('Centro' e 'Branco/Nulo'), a distribuição é mais equânime.
Segundo Gráfico (Figura 5): Mostrará a mesma informação mas apenas para a categoria 'Direita'.
Esses gráficos fornecem uma visualização clara de como a variabilidade dos dados está distribuída em torno da média. A visualização das linhas de desvio padrão ajuda a entender melhor a dispersão dos dados e a identificar a concentração dos valores.
Figura 4- Comparação da Distribuição dos Votos nas Categorias 'Esquerda', 'Centro' e 'Branco/Nulo'
Constata-se que, ao comparar a Figura 3 com a Figura 4, a adição de um ou mais desvios padrão na segunda figura proporciona uma maior clareza quanto às diferenças entre as três categorias comparadas.
Figura 5
Conclui-se que a descoberta esperada é que a cidade tem uma predisposição para votar à direita, o que fica claro nas diferentes distribuições comparadas. No entanto, o foco principal do texto é descrever as vantagens do uso do desvio padrão. A regra dos 68% e 95% pode ser muito útil para compreender a dispersão e a concentração dos dados.