El índice de Covarianza es el sumatorio de productos cruzados de las variables, dividido por N:
Una expresión equivalente es:
A partir de la Covarianza se ha derivado la siguiente fórmula del coeficiente de correlación de Pearson (esta fórmula es alternativa a la de productos cruzados de las variables tipificadas y da el mismo resultado):
Características
a) El índice de Covarianza toma:
b) El índice de Covarianza no tiene máximo ni tampoco mínimo.
c) El índice de Covarianza mide la covariación en la escala original de las variables y es sensible a la variabilidad, por tanto NO debe ser utilizada para hacer comparaciones cuando las escalas de las variables comparadas, o la variación, son diferentes.
El Coeficiente de Correlación de Pearson es una medida de la correspondencia o relación lineal entre dos variables cuantitativas aleatorias. En palabras más simples se puede definir como un índice utilizado para medir el grado de relación que tienen dos variables, ambas cuantitativas.
Teniendo dos variables, la correlación facilita que se hagan estimaciones del valor de una de ellas, con conocimiento del valor de la otra variable.
Este coeficiente es una medida que indica la situación relativa de los sucesos respecto a las dos variables, es decir, representa la expresión numérica que indica el grado de correspondencia o relación que existe entre las 2 variables. Estos números varían entre límites de +1 y -1.
Cálculo
Para contar con una guía que permita:
Para ello se hace uso del coeficiente de correlación de Pearson, definido como la covarianza que se da entre dos variables tipificadas y se calcula con la siguiente expresión:
Interpretación
Su dimensión indica el nivel de asociación entre las variables.
A valores altos en una de las variables, le suelen corresponder valores bajos en la otra variable y viceversa. Cuánto el valor esté más próximo a -1 dicho coeficiente de correlación más evidente será la covariación extrema.
Si r= -1 se habla de correlación negativa perfecta, la cual supone una determinación absoluta entre ambas variables, en sentido directo coexiste una relación lineal perfecta de pendiente negativa.
A valores altos en una de las variables, le corresponden valores altos en la otra variable e igualmente en una situación inversa sucede con los valores bajos. Cuánto más próximo a +1 se encuentre el coeficiente de correlación más evidente será la covariación.
Si r = 1 Se habla de correlación positiva perfecta, la cual supone una determinación absoluta entre las variables, en sentido directo coexiste una relación lineal perfecta de pendiente positiva).
No existe relación lineal, pero esto no implica necesariamente que las variables sean independientes, pudiendo existir relaciones no lineales entre las variables.
Cuando las dos variables son independientes se dice que están correlacionadas, aunque el resultado de reciprocidad no es necesariamente cierto.
Para concluir se puede decir que se ve más difícil de lo que resulta ser, sobre todo si se cuenta con tecnología avanzada, pues hoy día existen múltiples programas que facilitan esta labor de cálculo e interpretación del coeficiente de Pearson.