TESTES PARA MÉDIAS

Prof. Simone Soares Echeveste

Nesta unidade temática, você vai aprender

A identificar os tipos de problemas que podem ser analisados através do teste de hipóteses para médias t-student;
A compreender todos os passos e cálculos que compõem a realização dos testes de hipóteses para médias;
A concluir sobre os resultados obtidos de um testes de hipóteses para médias.

Introdução

Estudaremos aqui mais algumas importantes ferramentas de análise estatística muito utilizadas: os testes para médias, mais especificamente, o teste de hipóteses t-student. Esta ferramenta permite ao pesquisador verificar se uma afirmação sobre um parâmetro (média) pode ser aceita (generalizada) para toda a população ou não.

Em algumas situações de pesquisa existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não).

Nesse caso, precisamos ferramentas que permitam testar se uma afirmação é aceita ou rejeitada tendo como base as informações obtidas em uma amostra. O Teste de hipóteses viabiliza uma estrutura para que façamos isto e é útil quando desejamos verificar a alegação (afirmação) feita sobre um parâmetro, como a média.

Exemplos:

O peso médio dos cavalos é de 450 kg;
A taxa de glicose em suínos machos é superior à taxa em suínos fêmeas da mesma raça;
Os percentuais médios de produção total de ovos, ovos de ninho, ovos limpos e ovos quebrados possuem diferença significativa entre o horário de arraçoamento e de coleta em reprodutoras de frangos de corte ser feito pela manhã ou à tarde.

Um teste de hipóteses deve considerar alguns passos importantes na sua realização. Iniciamos com a determinação da hipótese a ser investigada ou, ainda, o efeito que desejamos comprovar e que deve se referir a algum parâmetro populacional. A hipótese estabelecida é comparada aos resultados obtidos considerando uma pesquisa realizada com uma amostra de “n” elementos.

As informações obtidas com os estimadores dos parâmetros de interesse adicionadas a alguns elementos de probabilidade permitirão ao pesquisador decidir se a hipótese é verdadeira ou não.

TESTES PARA MÉDIAS

Algumas vezes, existe um particular interesse em decidir sobre a validade de uma hipótese específica (se dois grupos têm a mesma média ou não, ou se o parâmetro populacional tem um valor em particular ou não). O Teste de hipóteses fornece-nos a estrutura para que façamos isso quando desejamos verificar a alegação (afirmação) feita sobre um parâmetro como por exemplo a média.

Figura 1: Etapas de um teste de hipóteses.

Fonte: Autora.

COMPONENTES DE UM TESTE DE HIPÓTESES

Um teste de hipóteses poderia ser descrito através de uma estratégia de análise com os seguintes elementos:

1º) Determinação do parâmetro de interesse no problema;

2º) Formulação das Hipóteses de pesquisa H0 e H1;

3º) Definição do nível de significância do teste (valor de "p");

4º) Determinação da estatística do teste a ser utilizada;

5º) Construção da regra de decisão a partir do nível de significância estabelecido;

6º) A partir dos resultados obtidos, decisão: aceitar ou rejeitar H0.

Os testes podem rejeitar ou aceitar a hipótese nula e nesta ação há dois possíveis tipos de erros:

Erro do tipo I: é o erro ao rejeitar H0 quando, na realidade, H0 é verdadeira. A probabilidade de cometer este erro do tipo I é designada por α (nível de significância). O erro do tipo I equivale a concluir que o tratamento é eficaz quando na verdade ele não é.
Erro do tipo II: é o erro ao aceitar H0 quando, na realidade, H0 é falsa. A probabilidade de cometer este erro do tipo II é designada por β.

Em um teste de hipóteses é obviamente desejável que se reduza ao mínimo as probabilidades α e β dos dois tipos de erros. Porém, a diminuição de se ter um erro implica no aumento de ter um outro erro. Em geral, escolhe-se pela diminuição do erro tipo I. A redução simultânea dos erros poderá ser alcançada pelo aumento do tamanho da amostra.

Quadro Resumo dos Tipos de erro de um teste de hipóteses

Vamos agora conhecer cada uma das etapas que compõem um teste de hipóteses.

HIPÓTESES DE PESQUISA

O primeiro passo consiste em formular hipóteses sobre a afirmação de estudo, que podem ser determinadas da seguinte forma:

Hipótese Nula (H0) estabelece a ausência de diferença entre os parâmetros. Nesta hipótese, estamos admitindo que a diferença entre o valor obtido na amostra e o valor do parâmetro NÃO É SIGNIFICATIVA, logo esta diferença é devida ao acaso.
Hipótese Alternativa (H1) é a hipótese contrária à H0, estabelecendo, com isso, uma DIFERENÇA SIGNIFICATIVA entre o valor amostral e o parâmetro populacional, podendo representar simplesmente uma desigualdade ou ainda a ideia de superioridade/inferioridade. Neste caso, a diferença observada NÃO é devida ao acaso.

Nos exemplos apresentados na introdução podemos destacar as hipóteses da seguinte forma:

O peso médio dos cavalos é de 450 kg.

H0: μ = 450 kg

H1: μ ≠ 450 kg

A taxa de glicose em suínos machos é superior à taxa em suínos fêmeas da mesma raça.

H0: μ machos = μ fêmeas

H1: μ machos ≠ μ fêmeas

ESTATÍSTICA DO TESTE

A estatística do teste é um valor calculado com as informações provenientes da amostra e utilizada para se tomar a decisão sobre a aceitação ou rejeição da hipótese nula (H0). Em seu cálculo, são consideradas informações estatísticas obtidas a partir da amostra investigada, bem como outros elementos relacionados à probabilidade de erro.

REGRA DE DECISÃO

Se o valor da estatística do teste cai dentro da região crítica, rejeitamos a hipótese (nula) H0, pois existe uma forte evidência amostral de sua falsidade. Ao contrário, se aceitamos H0, não existe evidência amostral significativa para sua rejeição.

CONCLUSÃO EXPERIMENTAL

Após a regra de decisão, o teste deve ter uma conclusão experimental onde o pesquisador, de acordo com o contexto do problema, irá concluir a sua análise. Na conclusão experimental o pesquisador terá subsídios científicos que o auxiliarão na tomada de decisão sobre o objeto de estudo.

Vamos ver agora dois dos testes de hipóteses mais utilizados.

TESTE DE HIPÓTESES PARA UMA MÉDIA (TESTE T – STUDENT PARA UMA AMOSTRA)

Utiliza-se este teste para comparar os valores obtidos em uma amostra com uma média estabelecida como referência.

Hipóteses

Regra de decisão

Na regra de decisão devemos considerar que a variável analisada tenha distribuição aproximadamente normal. Nesse caso, a partir dos valores da tabela t-student iremos definir os pontos de corte na regra de decisão, ou seja, a partir de que ponto inicia e termina a região crítica (região de rejeição).

A regra estabelece que se o valor calculado na estatística do teste for um valor localizado na região de aceitação, deveremos então aceitar a hipótese nula H0 que representa a decisão de que a diferença encontrada nos dados amostrais com os parâmetros populacionais NÃO é significativa.

Para o caso do valor calculado na estatística estar localizado na região crítica, deveremos então rejeitar a hipótese nula H0 que representa a decisão de que SIM, existe diferença significativa dos dados amostrais com os parâmetros populacionais.

Como obter o valor tabelado da Regra de Decisão

Utilizaremos aqui o valor da tabela t-student da mesma forma como já utilizamos para a construção dos Intervalos de Confiança utilizando a mesma tabela. A linha a ser utilizada corresponde aos graus de liberdade, obtidos a partir do tamanho da amostra investigada menos 1(n – 1). Já a coluna corresponderá ao nível de significância desejado do teste (p-value), que corresponde ao erro do teste – normalmente esse nível de significância é estabelecido em no máximo 5%.

EXEMPLO

Foi realizado na região Oeste do Paraná, no Município de Marechal Cândido Rondon, um levantamento da produtividade leiteira diária de 40 pequenos produtores rurais, atendidos pelo plano “Panela Cheia”. Nesse estudo, obteve-se uma produção média diária de 9,1 litros com desvio-padrão de 1,5 litros. A informação divulgada pelo secretário de agricultura do Estado Paraná é de que a produtividade diária média é igual a 11 litros. Através de um teste de hipóteses, com significância de 5%, analise esses dados e conclua sobre a afirmação do Secretário de Agricultura.

Neste exemplo, temos a situação de uma alegação realizada pelo secretário de agricultura (valor de referência) a respeito de uma parâmetro que corresponde à produtividade média diária de leite. Para comprovar essa afirmação, um estudo foi desenvolvido e, a partir dos resultados obtidos, desejamos verificar se podemos inferi-los para toda a população de interesse.

Passo 1. Dados do Problema

Variável (x): produtividade leiteira diária (litros)

μ0: 11 litros (valor de referência)

n = 40 pequenos produtores rurais

x = 9,1 litros (média obtida na amostra investigada)

s = 1,5 litros (desvio-padrão obtido na amostra investigada)

p = nível de significância do teste = 5% (p=0,05)

Passo 2. Determinação das hipóteses de pesquisa

H0: μ = 11 litros (valor de referência)

H1: μ ≠ 11 litros (valor de referência)

Passo 3. Cálculo da Estatística do Teste

t = -7,92

Precisamos agora decidir se esse valor representa um resultado significativo ou não e para isso vamos estabelecer nossa Regra de Decisão.

Passo 4. Regra de Decisão

Vamos agora identificar o valor tabelado a ser utilizado na Regra de Decisão: a amostra desta pesquisa foi de 40 pequenos produtores rurais, então o grau de liberdade (n-1) é 40 – 1 = 39 (linha 39 da tabela t). O nível de significância estabelecido no problema é de 5% - então a coluna a ser utilizada da tabela é a que corresponde 0,05.

O valor de “t” tabelado é, então, 2,023 – esse valor determinará na regra de decisão os limites da região crítica.

Fique de olho!

A regra estabelecida é: se o valor da estatística do teste for SUPERIOR a +2,023 ou INFERIOR a -2,023 nossa decisão será REJEITAR H0, ou seja, concluiremos que há diferença significativa entre os valores observados na amostra com o valor estabelecido como referência.

Já se o valor da estatística do teste estiver ENTRE -2,023 e +2,023 nossa decisão será de ACEITAR H0, o que implica na existência de uma diferença NÃO significativa entre os valores da amostra com a referência.

Para o nosso exemplo, o valor da estatística do teste foi de t = -7,92

Este valor (t=-7,92) está localizado, na nossa regra de decisão, FORA da região de aceitação (região azul) – então nossa decisão será REJEITAR H0. Ao rejeitar a hipótese nula H0 nossa conclusão estará determinada pela hipótese H1: μ ≠ 11 litros (valor de referência)

H0: μ = 11 litros (valor de referência)

H1: μ ≠ 11 litros (valor de referência)

No contexto do problema, estaremos então concluindo que a produtividade de leite diária é diferente de 11 litros, conforme havia afirmado o secretário da agricultura, ou seja, a diferença encontrada em relação a essa produtividade média na amostra foi SIGNIFICATIVA em relação ao valor de referência.

Passo 5. Conclusão

Na conclusão, escreveremos um parágrafo referente ao resultado final do teste de hipóteses:

Verifica-se através do teste estatístico realizado, ao nível de significância de 5%, que a produtividade leiteira diária difere significativamente de 11 litros conforme dito pelo secretário de agricultura. Observando os resultados obtidos na amostra, podemos concluir que esta produtividade é INFERIOR a 11 litros

TESTE DE HIPÓTESES PARA COMPARAÇÃO ENTRE DUAS MÉDIAS (T-STUDENT PARA DUAS AMOSTRAS)

Muitas vezes, nas pesquisas ocorre o interesse do pesquisador em comparar dois grupos de interesse em relação à uma variável de pesquisa através das suas médias, como por exemplo:

Qual marca de adubo A ou B produz melhores resultados?
Existe diferença significativa para o tempo de gestão entre duas raças de vacas?
Quem tem, em média, maior produtividade nas lavouras de soja: o estado de Santa Catarina ou o estado do Rio Grande do Sul?

Fique de olho!

Para este teste, não teremos um valor de referência a ser comparado, mas sim duas amostras provenientes de dois grupos distintos e o objetivo deste teste é comparar as médias destas duas amostras independentes verificando se existe ou não diferença significativa entre elas.

Esse teste é muito semelhante ao anteriormente visto, porém aqui não teremos um valor de referência a ser comparado, mas sim duas amostras provenientes de dois grupos distintos. O objetivo aqui é comparar as médias dessas duas amostras independentes, verificando se existe ou não diferença significativa entre elas.

Cada um dos grupos investigados (ou amostras investigadas) gera suas estatísticas descritivas que deverão ser utilizadas no cálculo da estatística do teste: tamanho da amostra, média amostral e desvio-padrão amostral.

As hipóteses são estabelecidas a partir da comparação da média dos grupos, na hipótese nula H0 novamente teremos a ausência de diferença significativa, ou seja, a média do grupo 1 é igual à média do grupo 2. Já a hipótese alternativa H1 indica que EXISTE diferença significativa entre as médias dos grupos 1 e 2.

Regra de decisão

A regra de decisão para este teste é praticamente a mesma do teste anterior, porém a única diferença refere-se aos graus de liberdade que agora, como teremos dois grupos, será: (n1 + n2 – 2), ou seja deve-se somar os tamanhos de amostra dos dois grupos e subtrair dois.

EXEMPLO

Os estercos animais, em função da sua grande disponibilidade e resposta no crescimento das plantas e no aumento da produção, são considerados como importantes adubos orgânicos. O esterco de bovinos é um dos adubos orgânicos mais utilizados na região, principalmente na produção de hortaliças e mudas de fruteiras. A análise estatística foi realizada usando-se os resultados analíticos de 12 amostras de cada adubo orgânico. Os resultados encontram-se na tabela abaixo.

Considerando essas amostras representativas de cada tipo de adubo, há diferença significativa para a quantidade de potássio entre os tipos de adubos acima comparados? Use um nível de significância máximo de 5%.

Passo 1. Dados do Problema

Variável (x): quantidade de potássio (g de K2O/kg)

x 1= 30,60 (média de potássio do tipo 1)

n1 = 12 (tamanho da amostra do tipo 1)

s1 = 6,6 (desvio-padrão do tipo 1)

x 2= 25,50 (média de potássio do tipo 2)

n2 = 12 (tamanho da amostra do tipo 2)

s2 = 3,2 (desvio-padrão do tipo 2)

p = nível de significância do teste = 5% (p=0,05)

Passo 2. Determinação das hipóteses de pesquisa

Passo 3. Cálculo da Estatística do Teste

t = 2,41

Passo 4 – Regra de Decisão

A tabela a ser utilizada é a mesma do teste anterior. Na linha, vamos obter os graus de liberdade (gl) considerando a soma dos dois tamanhos de amostra dos grupos menos 2: Gl: (n1+n2 – 2) = (12+12 - 2) = 22 (Na tabela não temos linha 78, então iremos para a mais próxima, que é a linha 60).

Agora, com essa informação já podemos definir a nossa regra de decisão:

Para o nosso exemplo o valor da estatística do teste foi: t= 2,41

Fique de olho!

Esse valor (t=2,41) está localizado, na nossa regra de decisão, FORA da região de aceitação ou, ainda, ele localiza-se na REGIÃO CRÍTICA – então nossa decisão será REJEITAR H0.

Ao rejeitar a hipótese nula H0 estaremos concordando com a afirmação feita em H1:

No contexto do problema, estaremos então concluindo que os tipos de adubos orgânicos (composto de lixo orgânico e esterco curtido de bovino) têm uma quantidade média de potássio DIFERENTE um do outro, ou seja, a diferença encontrada em relação à essa quantidade média de potássio na amostra investigada FOI SIGNIFICATIVA. Como essa diferença foi significativa, poderemos observar na amostra que a quantidade média de potássio para o tipo de adubo composto de lixo orgânico (x = 30,60) é SUPERIOR à quantidade média de potássio para o tipo de adubo esterco curtido de bovino (x = 25,50).

Passo 5 – Conclusão

Verifica-se através do teste estatístico realizado, ao nível de significância de 5%, que a quantidade média de potássio é significativamente DIFERENTE entre os dois tipos de adubo (composto de lixo orgânico e esterco curtido de bovino). Observa-se ao analisar os resultados da amostra que esta quantidade média de potássio é significativamente SUPERIOR para o adubo composto de lixo orgânico.

Referências

DOMINGUES, O., MARTINS, G. Estatística Geral Aplicada. 4. ed. São Paulo: Atlas, 2011

LARSON, R. e FARBER, B. Estatística Aplicada, 4. ed. São Paulo: Pearson, 2010.

LEVIN, J.; FOX, J.A.; FORDE, D.R. Estatística para ciências humanas. São Paulo: Pearson, 2012.

Créditos

Coordenação e Revisão Pedagógica: Claudiane Ramos Furtado

Design Instrucional: Gabriela Rossa

Diagramação: Marcelo Ferreira

Ilustrações: Rogério Lopes e Lucas Dias

Revisão ortográfica: Ane Arduim

Clique aqui para baixar o conteúdo deste tema

Report abuse