Test de Wilcoxon
Test de Wilcoxon
Texto
Este estadístico también se denomina prueba de rango con signos tiene la función de comparar medianas es decir lo hace por medio de un estadístico de tendencia central , es un estadístico alterno a la t de student relacionado, como sabemos la t de student es para medidas cuantitativas con distribución normal en este caso si es que no se alcanzara una distribución normal o fuera ordinales una de las variables entonces podemos usar el test de wilcoxon también esto es aplicable cuando los datos son pequeños o no tienen una distribución normal por este motivo es alterno o suple cuando no se puede aplicar la t de student para medidas relacionadas.
El propósito de este estadístico es comparar por este motivo se compara dos variables o dos grupos o dos muestra, las mediciones de estos grupos son relacionadas esto significa que se trata del mismo grupo con dos medidas 1 es la medida puede ser la medida pre y post los que se comparan, cuanto a la naturaleza de las variables pueden ser ordinales y también como dijimos se puede utilizar en variables cuantitativas o sea en unidades pero que no tiene una distribución normal entonces se aplica tanto para las originales como las cuantitativas que en unidades que no tengan una distribución normal
Tenemos el test de wilcoxon está es una medida ordina. suplementaria se puede decir o complementa la t de student y se aplica para dos grupos o sea se compara siempre comparamos dos o más no que en este caso es para el dos si fueran más está el estadístico, tenemos un ejercicio que lo vamos a ver en la parte práctica también tiene SPSS y que dice que buscamos conocer si es igual o diferente el consumo de carne en kilos en verano y en invierno entonces el consumo de carne en verano es A, el consumo en invierno es b de 8 personas que han tenido una primera medición que es esta y una segunda medición y vamos a comparar son mediciones que se le ha hecho a la al mismo grupo en dos momentos y por eso son medidas relaciona.
La hipótesis tenemos que el investigador buscará probar su hipótesis alterna y la hipótesis nula que se opone a la al alterna dice que la diferencia de medias es diferente de cero y la alterna dice que las medias o sea la separación entre ambas medias es diferente de cero hay diferencia de media esto es lo que significa si fueran igual a cero quieren decir que la estacionalidad l en verano o en invierno no influye en el consumo de carne pero si fuera diferente de cero entonces llegaríamos a la conclusión que la estacionalidad influye.
Este estadístico busca comparar , perola interpretación que le damos acá es una interpretación causal, entonces podemos ver que la comparación se sujeta al razonamiento que tiene el investigador si el investigador puede aprovechar esto para hacer una relación causal como en este caso si la estacionalidad influyó no en el consumo de carne que saca esa conclusión de la prueba de hipótesis o simplemente puedes llegar a la conclusión que son diferentes el consumo de carne, en ambas tengamos dos temporadas, entonces es un criterio que tiene el investigador mediante el cual saca sus conclusiones.
Ahora vamos a tener que en la prueba de hipótesis tiene dos elementos el P value, por lo general es de 0.05 esto es decimales qué es lo mismo que decir el 5% P value viene de Pearson, estoy hablando de significación del 5% que era el más adecuado y efectivamente la comunidad científica le ha dado la razón el valor de significancia menor a 0.05 estará dentro de la hipótesis alterna es decir hay diferente en cambio si es mayor.
Entonces es mucho el error entonces no podemos probar la hipótesis del investigador quedándonos con la hipótesis nula que indica que son iguales, lo que el investigador pretende probar es que existen diferencias eso es el propósito del investigador.
Para esto en el menú del programa SPSS, trabajamos con el menú analizar, ubicamos pruebas no paramétricas cuadro de diálogos antiguos y vamos dos muestras relacionadas. Pasamos las variables a y b también por defecto viene activado wilcoxon, entonces simplemente nos queda aceptar sí tenemos resultados, en el primer cuadro siempre lo tiene los descriptivos, viene la diferencia de rangos negativos positivos, los empates, esto viene justamente de la matriz.
Ahora vemos la eficacia simbólica de 0.596 es mayor hace 2.0 como es mayor está dentro te hipótesis nula que considera no haber diferencias o de ser iguales también sabemos el valor de z no sabemos el valor de z que viene de la distribución normal y qué hace aquí la distribución normal, es que también existe una forma de asociar la distribución normal con este caso que se trata de estadísticos no paramétricos pesar de ser no paramétricos.
También acá se considera una vez que se obtiene el valor de prueba comparar con la significancia que este 5% o 0.05 que en valor z es 1.96., si es menor como en este caso entonces también aceptamos la hipótesis nula esto lo que quiere decir es que viendo acá a lo que hemos puesto en para nuestra hipótesis nula que la estacionalidad no influye en el consumo de carne.
Ahora vamos a ver en la parte práctica como dijimos nos vamos a analizar y nos vamos a, estadísticos, pruebas no paramétricas , cuadro de diálogo, relacionadas entonces ya viene Wilcox simplemente pasamos las variables a contrastar ponemos aceptar, entonces salen los dos cuadros como sabemos primero viene el descriptivo acá vienen los rangos negativos cuatro, dos rangos positivos, dos empates la suma de los rangos es para los negativos estreses y los positivos 8 como toma 8 para el estadístico para contrastar con el estadístico de prueba acá tenemos el estadístico de prueba justamente como dijimos el valor z que es menor a 1.96 y la significancia bilateral que es mayor a 0.05 lo que nos deja dentro de la zona de bastante error por tanto aceptamos la hipótesis nula que considera no haber diferencias.
En otras palabras que el consumo de que la temporalidad no influye en el consumo de carne o la estación de verano o invierno no incluye consumo de café como dijimos esa es la interpretación que da el investigador que abstrae del razonamiento que se fundamenta en este estadístico