Alguns conceitos da estatística para duas séries de dados.
Quando existirem duas séries de dados, existirão várias medidas estatísticas que podem ser usadas para capturar como as duas séries se movem juntas através do tempo. As duas mais largamente usadas são a correlação e a covariância. Para duas séries de dados, X (X1,X2,...) e Y(Y1,Y2,...), a covariância fornece uma medida não padronizada do grau no qual elas se movem juntas, e é estimada tomando o produto dos desvios da média para cada variável em cada período.
O sinal na covariância indica o tipo de relação que as duas variáveis tem. Um sinal positivo indica que elas movem juntas e um negativo que elas movem em direções opostas. Enquanto a covariância cresce com o poder do relacionamento, ainda é relativamente difícil fazer julgamentos sobre o poder do relacionamento entre as duas variáveis observando a covariância, pois ela não é padronizada.
A correlação é a medida padronizada da relação entre duas variáveis. Ela pode ser calculada da covariância
A correlação nunca pode ser maior do que 1 ou menor do que menos 1. Uma correlação próxima a zero indica que as duas variáveis não estão relacionadas. Uma correlação positiva indica que as duas variáveis movem juntas, e a relação é forte quanto mais a correlação se aproxima de um. Uma correlação negativa indica que as duas variáveis movem-se em direções
opostas, e que a relação também fica mais forte quanto mais próxima de menos 1 a correlação ficar. Duas variáveis que estão perfeitamente correlacionadas positivamente (r=1) movem-se essencialmente em perfeita proporção na mesma direção, enquanto dois conjuntos que estão perfeitamente correlacionados negativamente movem-se em perfeita proporção em direções opostas.
Exemplo
Dados obtidos de 7 pares de pai-filho, amostrando o número de anos de escola cursados pelo pai (x) e o número de anos de escola cursados pelo filho (y).
a) Qual é o valor do coeficiente de correlação entre esses dados?
b) Qual é o seu significado?
Pai(x) 12 10 6 16 8 9 12
Filho(y) 12 8 6 11 10 8 11
Algoritmo()
{
vetor real x[7];
vetor real y[7];
real cov;
real corr;
real aux1;
real aux2;
x[] := {12, 10, 6, 16, 8, 9, 12};
y[] := {12, 8, 6, 11, 10, 8, 11};
cov := Covariancia(x[],y[]);
corr := Correlacao(x[],y[]);
escreva("Valor da covariancia: ",cov);
escreva("Valor da correlacao: ",corr);
// analisando os resultados
se (cov > 0)
{
escreva("as series se movem no mesmo sentido.");
}
senao
{
escreva("as series se movem em sentidos contrarios.");
}
// analise da correlacao
se (corr < -1 & corr > 1)
{
escreva("Erro no calculo da correlacao!");
}
se (corr==1)
{
escreva("as series estao perfeitamente correlacionadas.");
escreva("e movem-se no mesmo sentido.");
}
se (corr==-1)
{
escreva("as series estao perfeitamente correlacionadas.");
escreva("e movem-se em sentidos opostos.");
}
se (corr==0)
{
escreva("as series nao estao correlacionadas.");
}
se (corr > 0 & corr < 1)
{
escreva("as series se movem juntas.");
}
se (corr < 0 & corr > -1)
{
escreva("as series nao se movem juntas.");
}
// conclusao
escreva("-----------------------------------------------------");
se (corr > 0 & corr < 1)
{
escreva("o numero de anos de escola cursados pelo pai esta
positivamente correlacionado ao numero de anos de escola
cursados pelo filho.");
}
senao
{
escreva("o numero de anos de escola cursados pelo pai nao esta
positivamente correlacionado ao numero de anos de escola
cursados pelo filho.");
}
aux1 := corr*corr*100.0;
aux2 := (1 – corr*corr)*100.0;
escreva("-----------------------------------------------------");
escreva("o numero de anos de escola cursados pelo pai explica ");
escreva(aux1,"% da variancia do numero de anos de escola cursados");
escreva("pelo filho.");
escreva("Assim, ",aux2,"% da variancia da regressao depende");
escreva("de outras variaveis não estudadas no exemplo.");
}
Tela de Execução