A identificar os tipos de problemas que podem ser analisados através do teste de hipóteses para médias t-student;
A compreender todos os passos e cálculos que compõem a realização dos testes de hipóteses para médias;
A concluir sobre os resultados obtidos de um testes de hipóteses para médias.
Estudaremos aqui mais algumas importantes ferramentas de análise estatística muito utilizadas: os testes para médias, mais especificamente, o teste de hipóteses t-student. Esta ferramenta permite ao pesquisador verificar se uma afirmação sobre um parâmetro (média) pode ser aceita (generalizada) para toda a população ou não.
Em algumas situações de pesquisa existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não).
Nesse caso, precisamos ferramentas que permitam testar se uma afirmação é aceita ou rejeitada tendo como base as informações obtidas em uma amostra. O Teste de hipóteses viabiliza uma estrutura para que façamos isto e é útil quando desejamos verificar a alegação (afirmação) feita sobre um parâmetro, como a média.
Exemplos:
O peso médio dos cavalos é de 450 kg;
A taxa de glicose em suínos machos é superior à taxa em suínos fêmeas da mesma raça;
Os percentuais médios de produção total de ovos, ovos de ninho, ovos limpos e ovos quebrados possuem diferença significativa entre o horário de arraçoamento e de coleta em reprodutoras de frangos de corte ser feito pela manhã ou à tarde.
Um teste de hipóteses deve considerar alguns passos importantes na sua realização. Iniciamos com a determinação da hipótese a ser investigada ou, ainda, o efeito que desejamos comprovar e que deve se referir a algum parâmetro populacional. A hipótese estabelecida é comparada aos resultados obtidos considerando uma pesquisa realizada com uma amostra de “n” elementos.
As informações obtidas com os estimadores dos parâmetros de interesse adicionadas a alguns elementos de probabilidade permitirão ao pesquisador decidir se a hipótese é verdadeira ou não.
Algumas vezes, existe um particular interesse em decidir sobre a validade de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). O Teste de hipóteses fornece-nos a estrutura para que façamos isso quando desejamos verificar a alegação (afirmação) feita sobre um parâmetro como por exemplo a média.
1º) Determinação do parâmetro de interesse no problema;
2º) Formulação das Hipóteses de pesquisa H0 e H1;
3º) Definição do nível de significância do teste (valor de "p");
4º) Determinação da estatística do teste a ser utilizada;
5º) Construção da regra de decisão a partir do nível de significância estabelecido;
6º) A partir dos resultados obtidos, decisão: aceitar ou rejeitar H0.
Erro do tipo I: é o erro ao rejeitar H0 quando, na realidade, H0 é verdadeira. A probabilidade de cometer este erro do tipo I é designada por α (nível de significância). O erro do tipo I equivale a concluir que o tratamento é eficaz quando na verdade ele não é.
Erro do tipo II: é o erro ao aceitar H0 quando, na realidade, H0 é falsa. A probabilidade de cometer este erro do tipo II é designada por β.
Em um teste de hipóteses é obviamente desejável que se reduza ao mínimo as probabilidades α e β dos dois tipos de erros. Porém, a diminuição de se ter um erro implica no aumento de ter um outro erro. Em geral, escolhe-se pela diminuição do erro tipo I. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra.
Vamos agora conhecer cada uma das etapas que compõem um teste de hipóteses.
Hipótese Nula (H0) estabelece a ausência de diferença entre os parâmetros. Nesta hipótese, estamos admitindo que a diferença entre o valor obtido na amostra e o valor do parâmetro NÃO É SIGNIFICATIVA, logo esta diferença é devida ao acaso.
Hipótese Alternativa (H1) é a hipótese contrária à H0, estabelecendo, com isso, uma DIFERENÇA SIGNIFICATIVA entre o valor amostral e o parâmetro populacional, podendo representar simplesmente uma desigualdade ou ainda a ideia de superioridade/inferioridade. Neste caso, a diferença observada NÃO é devida ao acaso.
O peso médio dos cavalos é de 450 kg.
H0: μ = 450 kg
H1: μ ≠ 450 kg
H0: μ machos = μ fêmeas
H1: μ machos ≠ μ fêmeas
A estatística do teste é um valor calculado com as informações provenientes da amostra e utilizada para se tomar a decisão sobre a aceitação ou rejeição da hipótese nula (H0). Em seu cálculo, são consideradas informações estatísticas obtidas a partir da amostra investigada, bem como outros elementos relacionados à probabilidade de erro.
Se o valor da estatística do teste cai dentro da região crítica, rejeitamos a hipótese (nula) H0, pois existe uma forte evidência amostral de sua falsidade. Ao contrário, se aceitamos H0, não existe evidência amostral significativa para sua rejeição.
Após a regra de decisão, o teste deve ter uma conclusão experimental onde o pesquisador, de acordo com o contexto do problema, irá concluir a sua análise. Na conclusão experimental o pesquisador terá subsídios científicos que o auxiliarão na tomada de decisão sobre o objeto de estudo.
Vamos ver agora dois dos testes de hipóteses mais utilizados.
Utiliza-se este teste para comparar os valores obtidos em uma amostra com uma média estabelecida como referência.
Na regra de decisão devemos considerar que a variável analisada tenha distribuição aproximadamente normal. Nesse caso, a partir dos valores da tabela t-student iremos definir os pontos de corte na regra de decisão, ou seja, a partir de que ponto inicia e termina a região crítica (região de rejeição).
A regra estabelece que se o valor calculado na estatística do teste for um valor localizado na região de aceitação, deveremos então aceitar a hipótese nula H0 que representa a decisão de que a diferença encontrada nos dados amostrais com os parâmetros populacionais NÃO é significativa.
Para o caso do valor calculado na estatística estar localizado na região crítica, deveremos então rejeitar a hipótese nula H0 que representa a decisão de que SIM, existe diferença significativa dos dados amostrais com os parâmetros populacionais.
Utilizaremos aqui o valor da tabela t-student da mesma forma como já utilizamos para a construção dos Intervalos de Confiança utilizando a mesma tabela. A linha a ser utilizada corresponde aos graus de liberdade, obtidos a partir do tamanho da amostra investigada menos 1(n – 1). Já a coluna corresponderá ao nível de significância desejado do teste (p-value), que corresponde ao erro do teste – normalmente esse nível de significância é estabelecido em no máximo 5%.
Foi realizado na região Oeste do Paraná, no Município de Marechal Cândido Rondon, um levantamento da produtividade leiteira diária de 40 pequenos produtores rurais, atendidos pelo plano “Panela Cheia”. Nesse estudo, obteve-se uma produção média diária de 9,1 litros com desvio-padrão de 1,5 litros. A informação divulgada pelo secretário de agricultura do Estado Paraná é de que a produtividade diária média é igual a 11 litros. Através de um teste de hipóteses, com significância de 5%, analise esses dados e conclua sobre a afirmação do Secretário de Agricultura.
Neste exemplo, temos a situação de uma alegação realizada pelo secretário de agricultura (valor de referência) a respeito de uma parâmetro que corresponde à produtividade média diária de leite. Para comprovar essa afirmação, um estudo foi desenvolvido e, a partir dos resultados obtidos, desejamos verificar se podemos inferi-los para toda a população de interesse.
Passo 1. Dados do Problema
Variável (x): produtividade leiteira diária (litros)
μ0: 11 litros (valor de referência)
n = 40 pequenos produtores rurais
x = 9,1 litros (média obtida na amostra investigada)
s = 1,5 litros (desvio-padrão obtido na amostra investigada)
p = nível de significância do teste = 5% (p=0,05)
Passo 2. Determinação das hipóteses de pesquisa
H0: μ = 11 litros (valor de referência)
H1: μ ≠ 11 litros (valor de referência)
Passo 3. Cálculo da Estatística do Teste
t = -7,92
Precisamos agora decidir se esse valor representa um resultado significativo ou não e para isso vamos estabelecer nossa Regra de Decisão.
Passo 4. Regra de Decisão
Vamos agora identificar o valor tabelado a ser utilizado na Regra de Decisão: a amostra desta pesquisa foi de 40 pequenos produtores rurais, então o grau de liberdade (n-1) é 40 – 1 = 39 (linha 39 da tabela t). O nível de significância estabelecido no problema é de 5% - então a coluna a ser utilizada da tabela é a que corresponde 0,05.
O valor de “t” tabelado é, então, 2,023 – esse valor determinará na regra de decisão os limites da região crítica.
A regra estabelecida é: se o valor da estatística do teste for SUPERIOR a +2,023 ou INFERIOR a -2,023 nossa decisão será REJEITAR H0, ou seja, concluiremos que há diferença significativa entre os valores observados na amostra com o valor estabelecido como referência.
Já se o valor da estatística do teste estiver ENTRE -2,023 e +2,023 nossa decisão será de ACEITAR H0, o que implica na existência de uma diferença NÃO significativa entre os valores da amostra com a referência.
Para o nosso exemplo, o valor da estatística do teste foi de t = -7,92
Este valor (t=-7,92) está localizado, na nossa regra de decisão, FORA da região de aceitação (região azul) – então nossa decisão será REJEITAR H0. Ao rejeitar a hipótese nula H0 nossa conclusão estará determinada pela hipótese H1: μ ≠ 11 litros (valor de referência)
H0: μ = 11 litros (valor de referência)
H1: μ ≠ 11 litros (valor de referência)
No contexto do problema, estaremos então concluindo que a produtividade de leite diária é diferente de 11 litros, conforme havia afirmado o secretário da agricultura, ou seja, a diferença encontrada em relação a essa produtividade média na amostra foi SIGNIFICATIVA em relação ao valor de referência.
Passo 5. Conclusão
Na conclusão, escreveremos um parágrafo referente ao resultado final do teste de hipóteses:
Verifica-se através do teste estatístico realizado, ao nível de significância de 5%, que a produtividade leiteira diária difere significativamente de 11 litros conforme dito pelo secretário de agricultura. Observando os resultados obtidos na amostra, podemos concluir que esta produtividade é INFERIOR a 11 litros
Muitas vezes, nas pesquisas ocorre o interesse do pesquisador em comparar dois grupos de interesse em relação à uma variável de pesquisa através das suas médias, como por exemplo:
Qual marca de adubo A ou B produz melhores resultados?
Existe diferença significativa para o tempo de gestão entre duas raças de vacas?
Quem tem, em média, maior produtividade nas lavouras de soja: o estado de Santa Catarina ou o estado do Rio Grande do Sul?
Para este teste, não teremos um valor de referência a ser comparado, mas sim duas amostras provenientes de dois grupos distintos e o objetivo deste teste é comparar as médias destas duas amostras independentes verificando se existe ou não diferença significativa entre elas.
Esse teste é muito semelhante ao anteriormente visto, porém aqui não teremos um valor de referência a ser comparado, mas sim duas amostras provenientes de dois grupos distintos. O objetivo aqui é comparar as médias dessas duas amostras independentes, verificando se existe ou não diferença significativa entre elas.
Cada um dos grupos investigados (ou amostras investigadas) gera suas estatísticas descritivas que deverão ser utilizadas no cálculo da estatística do teste: tamanho da amostra, média amostral e desvio-padrão amostral.
As hipóteses são estabelecidas a partir da comparação da média dos grupos, na hipótese nula H0 novamente teremos a ausência de diferença significativa, ou seja, a média do grupo 1 é igual à média do grupo 2. Já a hipótese alternativa H1 indica que EXISTE diferença significativa entre as médias dos grupos 1 e 2.
A regra de decisão para este teste é praticamente a mesma do teste anterior, porém a única diferença refere-se aos graus de liberdade que agora, como teremos dois grupos, será: (n1 + n2 – 2), ou seja deve-se somar os tamanhos de amostra dos dois grupos e subtrair dois.
Os estercos animais, em função da sua grande disponibilidade e resposta no crescimento das plantas e no aumento da produção, são considerados como importantes adubos orgânicos. O esterco de bovinos é um dos adubos orgânicos mais utilizados na região, principalmente na produção de hortaliças e mudas de fruteiras. A análise estatística foi realizada usando-se os resultados analíticos de 12 amostras de cada adubo orgânico. Os resultados encontram-se na tabela abaixo.
Considerando essas amostras representativas de cada tipo de adubo, há diferença significativa para a quantidade de potássio entre os tipos de adubos acima comparados? Use um nível de significância máximo de 5%.
Passo 1. Dados do Problema
Variável (x): quantidade de potássio (g de K2O/kg)
x 1= 30,60 (média de potássio do tipo 1)
n1 = 12 (tamanho da amostra do tipo 1)
s1 = 6,6 (desvio-padrão do tipo 1)
x 2= 25,50 (média de potássio do tipo 2)
n2 = 12 (tamanho da amostra do tipo 2)
s2 = 3,2 (desvio-padrão do tipo 2)
p = nível de significância do teste = 5% (p=0,05)
Passo 2. Determinação das hipóteses de pesquisa
Passo 3. Cálculo da Estatística do Teste
t = 2,41
Passo 4 – Regra de Decisão
A tabela a ser utilizada é a mesma do teste anterior. Na linha, vamos obter os graus de liberdade (gl) considerando a soma dos dois tamanhos de amostra dos grupos menos 2: Gl: (n1+n2 – 2) = (12+12 - 2) = 22 (Na tabela não temos linha 78, então iremos para a mais próxima, que é a linha 60).
Agora, com essa informação já podemos definir a nossa regra de decisão:
Para o nosso exemplo o valor da estatística do teste foi: t= 2,41
Esse valor (t=2,41) está localizado, na nossa regra de decisão, FORA da região de aceitação ou, ainda, ele localiza-se na REGIÃO CRÍTICA – então nossa decisão será REJEITAR H0.
Ao rejeitar a hipótese nula H0 estaremos concordando com a afirmação feita em H1:
No contexto do problema, estaremos então concluindo que os tipos de adubos orgânicos (composto de lixo orgânico e esterco curtido de bovino) têm uma quantidade média de potássio DIFERENTE um do outro, ou seja, a diferença encontrada em relação à essa quantidade média de potássio na amostra investigada FOI SIGNIFICATIVA. Como essa diferença foi significativa, poderemos observar na amostra que a quantidade média de potássio para o tipo de adubo composto de lixo orgânico (x = 30,60) é SUPERIOR à quantidade média de potássio para o tipo de adubo esterco curtido de bovino (x = 25,50).
Passo 5 – Conclusão
Verifica-se através do teste estatístico realizado, ao nível de significância de 5%, que a quantidade média de potássio é significativamente DIFERENTE entre os dois tipos de adubo (composto de lixo orgânico e esterco curtido de bovino). Observa-se ao analisar os resultados da amostra que esta quantidade média de potássio é significativamente SUPERIOR para o adubo composto de lixo orgânico.
DOMINGUES, O., MARTINS, G. Estatística Geral Aplicada. 4. ed. São Paulo: Atlas, 2011
LARSON, R. e FARBER, B. Estatística Aplicada, 4. ed. São Paulo: Pearson, 2010.
LEVIN, J.; FOX, J.A.; FORDE, D.R. Estatística para ciências humanas. São Paulo: Pearson, 2012.
Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado
Design Instrucional: Gabriela Rossa
Diagramação: Marcelo Ferreira
Ilustrações: Rogério Lopes e Lucas Dias
Revisão ortográfica: Ane Arduim