Probabilidade, normalidade, hipóteses e testes

Fabiano Timbó - 2013

Sumário

Introdução

A estatística capta a ação do acaso como sendo o responsável pelo resultado encontrado.

A única certeza que ela dá é estimar qual probabilidade do evento ter ocorrido pela sorte.

Vamos treinar a tomada de decisões utilizando a estatística e analisando um simples arremesso de moeda para tirar cara ou cora.

Se você arremessa uma moeda honesta com lados cara e coroa 10 vezes para cima e acha 10 resultados coroa, como explicar tal evento?

(Pense um pouco ...)

Diante desta situação você tem duas possibilidades:

Possibilidade 1: Por sorte e ao acaso o resultado está se repetindo (Hipótese nula - ação do acaso).
Possibilidade 2: Toda vez que se arremessar uma moeda honesta com lados cara e coroa 10 vezes para cima o resultado sempre será coroa (Hipótese alternativa - o resultado é real).

Você agora vai ter de concluir, por si só, ou seja, tomar uma decisão sobre qual possibilidade aceitar e irá utilizar a estatística para te ajudar.

Decisão 1: Aceitar a possibilidade 1 (releia possibilidade 1).

(Pense um pouco .... Tome sua decisão)

Possivelmente você estará tomando a decisão certa, pois, parece realmente que o acaso é o responsável. Nós não temos certeza disso porque não vimos o experimento e não examinamos a moeda, mas esta seria a mais correta decisão. Você está dizendo que o resultado se dá ao acaso quando na realidade ele parece realmente ser conduzido pelo acaso.

Decisão 2: Rejeitar a possibilidade 1 (releia possibilidade 1).

(Pense um pouco .... Tome sua decisão)

Você está assumindo que toda vez que jogar a moeda vai dar coroa, ora, isso não é real. Você está tomando a decisão errada. Você está dizendo que o resultado não se dá ao acaso quando na verdade ele se dá ao acaso. Você está dizendo que o resultado é verdadeiro, positivo, real. Você está comentendo uma decisão errada. Você cometeu um erro falso-positivo (erro tipo I ou alfa).

Decisão 3: Rejeitar a possibilidade 2 (releia possibilidade 2).

(Pense um pouco .... Tome sua decisão)

Possivelmente você estará tomando a decisão certa, pois, parece realmente que o acaso é o responsável. Esta seria uma decisão correta apesar de você estar raciocinando pela possibilidade 2. É como se você só visualizasse a possibilidade 2. Você está dizendo que rejeita que o resultado seja real.

Decisão 4: Aceita a possibilidade 2 (releia possibilidade 2).

(Pense um pouco .... Tome sua decisão)

Você está assumindo que toda vez que jogar a moeda vai dar coroa, para você isso é real. Você está tomando a decisão errada. Você está dizendo que o resultado não é ao acaso quando na verdade ele se dá ao acaso. Você está negando a ação do acaso, deixando de reconhecer o acaso. Você cometeu um erro falso-negativo (erro tipo II ou beta).

Probabilidade

Como você viu a estatística trabalha com probabilidades, mas de quê?

Existe a probabilidade do evento ocorrer ao acaso (p) e dele não ocorrer ao acaso (q).

Ora p + q = 1, ou seja, p + q = 100%.

A probabilidade pode ser definida como o número de vezes que um dado evento possa ocorrer em relação ao número total de eventos.

P = n que o evendo PODE ocorrer / n total de eventos

A probabilidade de uma moeda honesta dar cara quando lançada ao alto é de 1 em 2 resultados.

P (cara) = 1 / 2 = 0,5 ou 50%.

A estatística trabalha apenas com o valor de p e ignora o valor de q. A probabilidade aceitável da ação do acaso é de 5% ou de 1 chance em 20 do evento ocorrer ao acaso.

Distribuição normal

Existe o normal estatístico que é diferente do normal conhecido como são ou pessoa sadia.

Em epidemiologia não é normal aquele que possuir algo que necessite ser tratado (pessoa vomitando sangue), estiver desrespeitando valores que representam a normalidade (quando uma pessoa possui níveis de glicose no sangue maiores que 100 mg/dL ela será o quê?) e quando for diferente do que se considera normal para a maioria das pessoas (uma pessoa que tem aultura de 2,30 m).

Para a Organização Mundial de Saúde normal é ter um estado de completo bem estar físico, social e mental. Quem não estiver assim estará anormal ou doente.

Em estatística quando a distribuição dos dados for simétrica ela é conhecida como distribuição normal. Uma dica: se os valores numéricos de média, moda e mediana forem iguais então há o normal estatístico. Grandes amostras de variáveis aleatórias (quando sua variação ocorre ao acaso) permitem a construção de um gráfico que apresenta uma forma típica semelhante ao desenho de um sino conhecida como curva normal (Figura 1).

Figura 1. Gráfico da distribuição normal dos dados

A área sob a curva normal é aquela porção do plano situada entre a linha de base e a curva que corresponde a 100% dos dados considerados. Usando a média como ponto zero pode-se dizer que 34,13% dos dados situam-se entre a média e um desvio-padrão (DP) para o seu lado direito (+ 1DP) (figura 1). Como a mesma proporção dos dados estão do lado esquerdo da curva então 34,13% dos dados também se situam entre a média e um desvio-padrão (– 1DP) (figura 1). A soma dos lados direito e esquerdo da média, ou seja, a soma das proporções entre +1DP e -1DP, corresponde a 68,26% dos escores (figura 1). A freqüência dos dados que se situam entre a média e + 2DP corresponde a 47,72% e entre a média e +3DP, 49,87%.

Há testes estatísticos para dados com distribuição normal e testes para dados sem esta distribuição alguns exemplos estão nos anexos desta página.

Hipóteses estatísticas

As hipóteses são respostas provisórias a perguntas quaisquer.

Por exemplo: Como explicar o 11 de setembro de 2001 aos Estados Unidos da América (Figura 2)?

Hipótese 1: Demonstração da força da fé Islâmica através da violência com um ataque da Al-Qaeda;

Hipótese 2: Ataque orquestrado para valorizar ações na Bolsa de valores de Nova York e no resto do planeta;

Hipótese 3: Ataque orquestrado pelos próprios norte-americanos. Aviões eram hologramas de última geração utilizados no cinema e explosivos foram postos nas bases do prédio com sincronização de tempo.

Figura 2. Ataques em 11 de setembro de 2001.

Em estatística também existem hipóteses. A hipótese que diz tudo ocorrer ao acaso ou hipótese de nulidade (H0) e hipótese alternativa que diz que o evento não ocorreu ao acaso (Ha).

As hipóteses com médias por exemplo podem nos ajudar. A média do Grupo 1 foi de 10 U e a média do Grupo 2 foi de 10,7 U. Os valores são diferentes, mas o que diz a estatística?

Hipótese nula: Os valores são diferentes apenas, só os valores numéricos, mas este resultado ocorreu ao acaso em virtude de serem participantes diferentes. Como o acaso ocorreu os resultados na realidade são iguais (lembre-se do exemplo da decisão da moeda).
Hipótese alternativa: Os valores são diferentes, valores numéricos nos grupos e na realidade também. Não houve ação do acaso para levar a resultados diferentes.Os resultados são realmente diferentes (lembre-se do exemplo da decisão da moeda).

Testes de hipóteses

Os testes estatísticos de hipóteses servem para testar qual das hipóteses deve ser aceita: nulidade ou alternativa. O teste conduz a um valor de p. Este p representa a proporção do resultado ter ocorrido ao acaso.

Então examine estes valores de p:

a) 0,9 ou 90%

b) 0,5 ou 50%

c) 0,1 ou 10%

d) 0,05 ou 5%

e) 0,001 ou 0,1%

Qual deles representa que o evento ocorreu ao acaso? O ideal seria o valor 0,0 para representar nenhuma ação do acaso.

Não sei o que você está esperando, mas tudo é número e nunca você terá um valor 0,0.

(Pense um pouco ... !)

Deve haver um valor que a partir do qual se considere a ação do acaso?

(Pense um pouco ... mais ...)

Arbitrariamente na área da saúde este valor é de 5%, então toda vez que o valor de p for MAIOR QUE 5% você aceitará a hipótese nula e toda vez que p for MENOR QUE 5% VOCÊ rejeitará hipótese nula.

Então para estes valores de p:

a) 0,9 ou 90% - aceitar hipótese nula

b) 0,5 ou 50% - aceitar hipótese nula

c) 0,1 ou 10% - aceitar hipótese nula

d) 0,05 ou 5% - rejeitar hipótese nula

e) 0,001 ou 0,1% - rejeitar hipótese nula

Há muitos testes estatísticos diferentes e você poderá ver alguns nos anexos desta página.

Significância estatística

No exemplo das médias acima se o valor de p fosse 0,001 você rejeitaria a hipótese de nulidade e decidiria que as médias são diferentes realmente sem ação do acaso ou que há uma chance menor que 5% do resultado diferente ter ocorrido ao acaso ou que a chance do evento existir no experimento e não existir na população que gerou a amostra é de 0,1%.

Quando isso ocorre diz-se que houve significância estatística.

No exemplo das médias acima se o valor de p fosse 0,1 você aceitaria a hipótese de nulidade e decidiria que as médias são diferentes ao acaso ou que há uma chance maior que 5% do resultado diferente ter ocorrido ao acaso ou que a chance do evento existir no experimento e não existir na população que gerou a amostra é de 10%.

Quando isso ocorre diz-se que não houve significância estatística.

Aula de probabilidades, distribuição normal, hipóteses e testes

Há duas formas de arrumar seus dados: estatística descritiva e estatística analítica. Veja anexo desta página.

AULA 3 - Probabilidade

Valor de p