Probabilidade, normalidade, hipóteses e testes
Fabiano Timbó - 2013
Sumário
Introdução
A estatística capta a ação do acaso como sendo o responsável pelo resultado encontrado.
A única certeza que ela dá é estimar qual probabilidade do evento ter ocorrido pela sorte.
Vamos treinar a tomada de decisões utilizando a estatística e analisando um simples arremesso de moeda para tirar cara ou cora.
Se você arremessa uma moeda honesta com lados cara e coroa 10 vezes para cima e acha 10 resultados coroa, como explicar tal evento?
(Pense um pouco ...)
Diante desta situação você tem duas possibilidades:
Possibilidade 1: Por sorte e ao acaso o resultado está se repetindo (Hipótese nula - ação do acaso).
Possibilidade 2: Toda vez que se arremessar uma moeda honesta com lados cara e coroa 10 vezes para cima o resultado sempre será coroa (Hipótese alternativa - o resultado é real).
Você agora vai ter de concluir, por si só, ou seja, tomar uma decisão sobre qual possibilidade aceitar e irá utilizar a estatística para te ajudar.
Decisão 1: Aceitar a possibilidade 1 (releia possibilidade 1).
(Pense um pouco .... Tome sua decisão)
Possivelmente você estará tomando a decisão certa, pois, parece realmente que o acaso é o responsável. Nós não temos certeza disso porque não vimos o experimento e não examinamos a moeda, mas esta seria a mais correta decisão. Você está dizendo que o resultado se dá ao acaso quando na realidade ele parece realmente ser conduzido pelo acaso.
Decisão 2: Rejeitar a possibilidade 1 (releia possibilidade 1).
(Pense um pouco .... Tome sua decisão)
Você está assumindo que toda vez que jogar a moeda vai dar coroa, ora, isso não é real. Você está tomando a decisão errada. Você está dizendo que o resultado não se dá ao acaso quando na verdade ele se dá ao acaso. Você está dizendo que o resultado é verdadeiro, positivo, real. Você está comentendo uma decisão errada. Você cometeu um erro falso-positivo (erro tipo I ou alfa).
Decisão 3: Rejeitar a possibilidade 2 (releia possibilidade 2).
(Pense um pouco .... Tome sua decisão)
Possivelmente você estará tomando a decisão certa, pois, parece realmente que o acaso é o responsável. Esta seria uma decisão correta apesar de você estar raciocinando pela possibilidade 2. É como se você só visualizasse a possibilidade 2. Você está dizendo que rejeita que o resultado seja real.
Decisão 4: Aceita a possibilidade 2 (releia possibilidade 2).
(Pense um pouco .... Tome sua decisão)
Você está assumindo que toda vez que jogar a moeda vai dar coroa, para você isso é real. Você está tomando a decisão errada. Você está dizendo que o resultado não é ao acaso quando na verdade ele se dá ao acaso. Você está negando a ação do acaso, deixando de reconhecer o acaso. Você cometeu um erro falso-negativo (erro tipo II ou beta).
Probabilidade
Como você viu a estatística trabalha com probabilidades, mas de quê?
Existe a probabilidade do evento ocorrer ao acaso (p) e dele não ocorrer ao acaso (q).
Ora p + q = 1, ou seja, p + q = 100%.
A probabilidade pode ser definida como o número de vezes que um dado evento possa ocorrer em relação ao número total de eventos.
P = n que o evendo PODE ocorrer / n total de eventos
A probabilidade de uma moeda honesta dar cara quando lançada ao alto é de 1 em 2 resultados.
P (cara) = 1 / 2 = 0,5 ou 50%.
A estatística trabalha apenas com o valor de p e ignora o valor de q. A probabilidade aceitável da ação do acaso é de 5% ou de 1 chance em 20 do evento ocorrer ao acaso.
Distribuição normal
Existe o normal estatístico que é diferente do normal conhecido como são ou pessoa sadia.
Em epidemiologia não é normal aquele que possuir algo que necessite ser tratado (pessoa vomitando sangue), estiver desrespeitando valores que representam a normalidade (quando uma pessoa possui níveis de glicose no sangue maiores que 100 mg/dL ela será o quê?) e quando for diferente do que se considera normal para a maioria das pessoas (uma pessoa que tem aultura de 2,30 m).
Para a Organização Mundial de Saúde normal é ter um estado de completo bem estar físico, social e mental. Quem não estiver assim estará anormal ou doente.
Em estatística quando a distribuição dos dados for simétrica ela é conhecida como distribuição normal. Uma dica: se os valores numéricos de média, moda e mediana forem iguais então há o normal estatístico. Grandes amostras de variáveis aleatórias (quando sua variação ocorre ao acaso) permitem a construção de um gráfico que apresenta uma forma típica semelhante ao desenho de um sino conhecida como curva normal (Figura 1).
Figura 1. Gráfico da distribuição normal dos dados
A área sob a curva normal é aquela porção do plano situada entre a linha de base e a curva que corresponde a 100% dos dados considerados. Usando a média como ponto zero pode-se dizer que 34,13% dos dados situam-se entre a média e um desvio-padrão (DP) para o seu lado direito (+ 1DP) (figura 1). Como a mesma proporção dos dados estão do lado esquerdo da curva então 34,13% dos dados também se situam entre a média e um desvio-padrão (– 1DP) (figura 1). A soma dos lados direito e esquerdo da média, ou seja, a soma das proporções entre +1DP e -1DP, corresponde a 68,26% dos escores (figura 1). A freqüência dos dados que se situam entre a média e + 2DP corresponde a 47,72% e entre a média e +3DP, 49,87%.
Há testes estatísticos para dados com distribuição normal e testes para dados sem esta distribuição alguns exemplos estão nos anexos desta página.
Hipóteses estatísticas
As hipóteses são respostas provisórias a perguntas quaisquer.
Por exemplo: Como explicar o 11 de setembro de 2001 aos Estados Unidos da América (Figura 2)?
Hipótese 1: Demonstração da força da fé Islâmica através da violência com um ataque da Al-Qaeda;
Hipótese 2: Ataque orquestrado para valorizar ações na Bolsa de valores de Nova York e no resto do planeta;
Hipótese 3: Ataque orquestrado pelos próprios norte-americanos. Aviões eram hologramas de última geração utilizados no cinema e explosivos foram postos nas bases do prédio com sincronização de tempo.
Figura 2. Ataques em 11 de setembro de 2001.
Em estatística também existem hipóteses. A hipótese que diz tudo ocorrer ao acaso ou hipótese de nulidade (H0) e hipótese alternativa que diz que o evento não ocorreu ao acaso (Ha).
As hipóteses com médias por exemplo podem nos ajudar. A média do Grupo 1 foi de 10 U e a média do Grupo 2 foi de 10,7 U. Os valores são diferentes, mas o que diz a estatística?
Hipótese nula: Os valores são diferentes apenas, só os valores numéricos, mas este resultado ocorreu ao acaso em virtude de serem participantes diferentes. Como o acaso ocorreu os resultados na realidade são iguais (lembre-se do exemplo da decisão da moeda).
Hipótese alternativa: Os valores são diferentes, valores numéricos nos grupos e na realidade também. Não houve ação do acaso para levar a resultados diferentes.Os resultados são realmente diferentes (lembre-se do exemplo da decisão da moeda).
Testes de hipóteses
Os testes estatísticos de hipóteses servem para testar qual das hipóteses deve ser aceita: nulidade ou alternativa. O teste conduz a um valor de p. Este p representa a proporção do resultado ter ocorrido ao acaso.
Então examine estes valores de p:
a) 0,9 ou 90%
b) 0,5 ou 50%
c) 0,1 ou 10%
d) 0,05 ou 5%
e) 0,001 ou 0,1%
Qual deles representa que o evento ocorreu ao acaso? O ideal seria o valor 0,0 para representar nenhuma ação do acaso.
Não sei o que você está esperando, mas tudo é número e nunca você terá um valor 0,0.
(Pense um pouco ... !)
Deve haver um valor que a partir do qual se considere a ação do acaso?
(Pense um pouco ... mais ...)
Arbitrariamente na área da saúde este valor é de 5%, então toda vez que o valor de p for MAIOR QUE 5% você aceitará a hipótese nula e toda vez que p for MENOR QUE 5% VOCÊ rejeitará hipótese nula.
Então para estes valores de p:
a) 0,9 ou 90% - aceitar hipótese nula
b) 0,5 ou 50% - aceitar hipótese nula
c) 0,1 ou 10% - aceitar hipótese nula
d) 0,05 ou 5% - rejeitar hipótese nula
e) 0,001 ou 0,1% - rejeitar hipótese nula
Há muitos testes estatísticos diferentes e você poderá ver alguns nos anexos desta página.
Significância estatística
No exemplo das médias acima se o valor de p fosse 0,001 você rejeitaria a hipótese de nulidade e decidiria que as médias são diferentes realmente sem ação do acaso ou que há uma chance menor que 5% do resultado diferente ter ocorrido ao acaso ou que a chance do evento existir no experimento e não existir na população que gerou a amostra é de 0,1%.
Quando isso ocorre diz-se que houve significância estatística.
No exemplo das médias acima se o valor de p fosse 0,1 você aceitaria a hipótese de nulidade e decidiria que as médias são diferentes ao acaso ou que há uma chance maior que 5% do resultado diferente ter ocorrido ao acaso ou que a chance do evento existir no experimento e não existir na população que gerou a amostra é de 10%.
Quando isso ocorre diz-se que não houve significância estatística.
Aula de probabilidades, distribuição normal, hipóteses e testes
Há duas formas de arrumar seus dados: estatística descritiva e estatística analítica. Veja anexo desta página.
Valor de p
<Final da página>