Pruebas para una Población

Pruebas de Hipótesis Sobre Una Población

 

1. Introducción

En varias ocasiones es importante proponer hipótesis sobre una población. Ejemplos:

  • 1. ¿Los datos observados provienen de una población con cierto valor promedio?. En este caso deseamos determinar si la muestra proviene de una población con media = Mu (Ho) en contra de la hipótesis alternativa: (Ha) media <> Mu. Otras opciones son alternativas de un solo lado, es decir, Ho puede ser media >= Mu o media =< Mu.
  • 2. ¿Los datos son representados por cierta distribución probabilística?. El desarrollo de planes de muestreo secuencial se basa en algunas distribuciones probabilísticas, por lo que primero es necesario determinar si alguna distribución representa los datos observados. Por ejemplo, en muchas ocasiones las distribuciones Poisson y binomial negativa se han utilizado para representar los conteos de insectos.
  • 3. Una pregunta relacionada con el primer inciso es: ¿La razón entre dos estimadores corresponde a cierto valor?. Por ejemplo, la relación varianza/media para conteos de insectos toma valores en el rango: 0 < (S2/media) < infinito. Si la varianza es igual a la media, los datos provienen de conteos dispuestos al azar, si S2 /media < 1 estos conteos son regulares, si S2/media > 1 los conteos se disponen en agregados.

 

En los ejemplos 1 y 3, hablamos de una prueba de localización, es decir, deseamos saber si la muestra proviene de una población distribuida alrededor de cierto punto, generalmente la media. En el segundo caso, deseamos saber si la muestra se puede representar con cierta distribución "modelo", es decir, estamos hablando de pruebas de bondad de ajuste que sirven para seleccionar modelos probabilísticos.

 

2. Pruebas de Localidad

La prueba clásica es determinar si los valores observados provienen de una población con cierta valor medio (Mu). Por ejemplo, se conoce que el rendimiento promedio de maíz es de 6 ton/ha para una variedad sembrada en cierta región. Este valor se puede tomar como un parámetro. Una nueva variedad, evaluada en cinco lotes (repeticiones), produce un rendimiento de 7.4 ton/ha. La pregunta es: ¿Esta muestra proviene de una población con una media de 6 ton/ha?. Si la nueva variedad efectivamente tiene un rendimiento mayor, entonces sería factible proponerla como alternativa a la variedad convencional.

Para determinar si la media de la población es mayor que 6 debemos rechazar la proposición opuesta, es decir, que el rendimiento es menor o igual a 6. Esta última proposición se conoce como hipótesis nula (Ho) y corresponde al valor de producción de la variedad convencional (Ho: Mu <= 6); la hipótesis alternativa Ha corresponde a Mu> 6. El procedimiento consiste en calcular la probabilidad de ocurrencia de un valor de 7.4 cuando Ho es cierta. Si esta probabilidad es pequeña (digamos 0.05), es más factible que la media sea mayor de 6 ton/ha y rechazamos Ho. Aun así podremos equivocarnos, pero este error sería bajo (0.05), es decir, en promedio, en 5 de 100 repeticiones de estos ensayos encontraríamos un valor de 7.4 cuando el rendimiento promedio es de 6 ton/ha. Con este error tan bajo podemos correr el riesgo y rechazar Ho. Por otra parte, si la probabilidad es alta, esto significa que el valor 7.4 es común cuando la media de producción es de 6 ton/ha y no recomendaríamos la nueva variedad. Para determinar esta probabilidad se necesita conocer la variabilidad en la producción, es decir, la varianza. La varianza puede estimarse a partir la muestra de producción de la nueva variedad. El Cuadro 1 muestra los valores de rendimiento en cinco ensayos.

Cuadro 1. Rendimiento de maíz en cinco ensayos.

Ensayo

Rendimiento

1

5.6

2

7.8

3

8.1

4

6.3

5

9.2

Estadísticas

Valor

Total

37.0

Media

7.4

Var

2.08

Error estándar, sqrt(s/n)

0.645

La estadística de prueba en este caso es t:

= (7.4 - 6)/ 0.645 = 2.17

 

Como se describe en la sección de la distribución de t, el valor de 2.17 indica la distancia entre la media muestral (7.4) y la media poblacional (6), en términos del error estándar de la media. Si la hipótesis nula es cierta, la variable aleatoria t tiene una distribución de Student con n-1 grados de libertad (5-1= 4). Esta distribución tiene una media de cero. El punto es saber si valores de t mayores o iguales a 2.17 son comunes cuando este valor (Mu=6) es cierto; si así es, Ho no se rechaza, pues los valores de t son comunes, de otra manera se rechaza Ho. La probabilidad de encontrar valores mayores o iguales a 2.17 (un solo lado) es 0.047, y se encuentra en el margen de rechazo. Puesto que este valor es relativamente pequeño se concluye que la media no es menor o igual a 6, es decir, se rechaza Ho. Sin embargo, puesto que el valor de P no es muy conclusivo, es conveniente recomendar la realización de otros ensayos con esta nueva variedad para confirmar los resultados.

 

3. Pruebas de Bondad de Ajuste de Distribuciones

Las pruebas de bondad de ajuste tienen como objetivo determinar si una distribución representa alguna variable de interés. Es decir, estas pruebas contestan la pregunta: ¿Existe algún modelo probabilístico que represente (describa) los datos?. En el caso de insectos, es importante determinar qué modelo probabilístico representa los conteos de insectos cuando se pretende establecer planes de muestreo secuencial empleando dichos modelos, por ejemplo, la binomial negativa. La idea principal de las pruebas de bondad de ajuste es medir las discrepancias entre los valores observados de la muestra y los predichos por el modelo a probar (también llamados valores o estimadores esperados). Si el modelo es apropiado, estas discrepancias serán pequeñas; serán grandes si las diferencias entre el modelo y los datos son grandes. Las pruebas de bondad de ajuste son propiamente numéricas, sin embargo, en algunas ocasiones es necesario realizar análisis gráficos entre los valores observados o predichos y con esto podemos evaluar cualitativamente la bondad de ajuste de una distribución.

 

3.1. Métodos Gráficos

Estas no son pruebas en el sentido estadístico, más bien son gráficas que comparan los datos observados con los predichos por una distribución. Una manera simple de probar la concordancia entre observados y predichos es la elaboración de tablas de frecuencias que incluyan estos valores. Para elaborar una gráfica de este tipo es necesario tener estimadores de los parámetros del modelo, posteriormente, con estos se determinan las probabilidades esperadas. Si la variable es discreta se pueden obtener probabilidades para cada valor de la variable aleatoria, para variables continuas el cálculo de probabilidades requiere agrupar los datos en clases y obtener probabilidades por intervalos o sobreponer la función de densidad. Por ejemplo, la Fig. 1 representa los conteos de 250 observaciones extraídas al azar de un población normal (5,7) junto con los valores predichos por el modelo normal. Los detalles se describen más adelante, pero es importante destacar qué las gráficas muestran cualitativamente la representatividad del modelo. Se observa en la Fig.1 una concordancia razonable entre los valores observados y los predichos por el modelo.

 

Figura 1. Histograma de frecuencias de valores observados (barras) y predichos por el modelo normal (línea) de 250 observaciones extraídas al azar de una población normal N(5, 7) mediante simulación Monte Carlo.

 

Otra alternativa de análisis gráficos es mediante la representación de las probabilidades acumuladas, tanto observadas como las predichas con el modelo. En este caso, las probabilidades acumuladas observadas se estiman como:

F(Yi)= (i -0.5)/ n, donde i corresponde a la posición ordenada de la variable Y, 0.5 es un factor de corrección para evitar que F(Yn) sea igual a uno, lo cual es inconveniente desde el punto de vista teórico ya que muchas distribuciones se aproximan asintóticamente pero no alcanzan el valor de F(Yn) = 1.0. El valor predicho de F depende del modelo. La Fig. 2 muestra los valores observados y predichos de las probabilidades acumuladas del ejemplo previo. En este caso, los valores predichos corresponden a P(Z < z), donde z = (Yi- mu)/ sqrt(varianza).

 

Figura 2. Probabilidades acumuladas (función de Probabilidad acumulada) de 250 observaciones extraídas al azar de un modelo normal(5, 7), la línea continua representa los valores predichos por el modelo normal.

 

Una gráfica generalizada es la representación de valores observados contra los predichos por el modelo. Este tipo de gráficas se emplea no sólo para el ajuste de modelos probabilísticos sino para cualquier modelo que intente representar las observaciones. La Fig. 3 muestra los valores observados contra los predichos del conjunto de datos anteriores, extraídos de una distribución normal N(5,7), si hubiese un perfecto ajuste, los valores se ordenarían en un recta de 45°.

 

Figura 3. Valores observados contra predichos. Los datos corresponden a 250 observaciones normales.

 

Para algunas distribuciones, por ejemplo la normal, es posible calcular el valor inverso (predicho) de la función de densidad basado en las observaciones realizadas. Estos valores se pueden graficar contra las observaciones reales; si los datos provienen de una distribución normal, la gráfica muestra un tendencia lineal (Fig. 4). Este método se describe con detalle en la distribución normal.

 

Figura 4. Representación gráfica de valores observados (Y) contra la función de densidad o Desviación Normal Equivalente de acuerdo al modelo normal. Si el modelo representa los conteos, los puntos se alinean en una recta.

 

3.2. Pruebas Numéricas

Estas pruebas sirven para evaluar cuantitativamente (estadísticamente) si un modelo representa las observaciones de interés (muestra). Como se mencionó previamente, la idea principal es calcular un índice basado en las desviaciones entre observados y predichos. El ejemplo que a continuación se ilustra (Cuadro 2) corresponde a frecuencias registradas (Obs) de capturas de pulgones por charola en un pastizal (n=200 charolas). Los datos se ajustaron a dos modelos, Poisson (Poiss) y Binomial Negativa (BN, Fig. 5). Los parámetros de la Poisson se estimaron por momentos, mientras que los de la BN fueron estimados por máxima verosimilitud. Se empleó el programa PADIS para realizar estos ajustes.

Cuadro 2. Frecuencia (Obs) de Pulgones por charola y valores esperados por los modelos Poisson (Poiss) y Binomial Negativo (BN). Ajuste de Poisson por momentos y BN por máxima verosimilitud.

 

 

 

 

 

 

Pulg/Char

Obs

Poiss

BN

0

39

2.75

39.03

1

30

11.80

30.72

2

18

25.29

24.63

3

31

36.12

19.86

4

15

38.69

16.07

5

18

33.16

13.02

6

6

23.68

10.57

7

10

14.49

8.58

8

3

7.76

6.97

9

7

3.69

5.67

10

2

1.58

4.61

11

2

0.61

3.75

12

3

0.22

3.05

13

3

0.07

2.48

14

2

0.02

2.05

15

4

0.006

1.64

16

1

0.001

1.34

17

1

0

1.09

18

0

0

0.89

19

0

0

0.72

20

0

0

0.59

21

0

0

0.48

22

1

0

0.39

23

3

0

0.32

24

0

0

0.26

25

0

0

0.21

26

1

0

0.93

 

Parámetros estimados de la muestra:

Media: 4.2850 , Varianza: 24.2651, K3= 0.964291 (Ver BN, estimación de parámetros)

Lo importante de este ejemplo es que podemos observar que los dos modelos representan los datos observados (frecuencias) con diferente precisión, el cuadro previo muestra que la Poisson tiene una distribución menos dispersa que los datos observados, por lo tanto la discrepancia (para cada clase) es mayor que en el caso de la BN. La Fig. 6 ilustra este punto con mayor claridad, se observa que las mayores diferencias se encuentran con el modelo Poisson mientras que la BN parece representar mejor los datos.

 

 

Figura 5. Gráfica de frecuencias observadas (negro) y frecuencias predichas por la distribución binomial negativa (gris). Los datos se tomaron del Cuadro 1.

 

Figura 6. Diferencias entre valores (frecuencias) observadas y predichas, de acuerdo a dos modelos: Poisson y Binomial Negativa. Se observa que las mayores diferencias ocurren con el modelo Poisson y el mejor ajuste (menores diferencias) ocurren con la distribución BN.

 

La variable Ji Cuadrada es un modelo probabilístico que representa estas diferencias. Los detalles se encuentran descritos en otra sección. Conviene mencionar que algunos modelos tienen distintas formas de estimar parámetros y cada forma de estimación producirá valores distintos, por lo que la prueba de bondad de ajuste difiere. Por lo tanto, es importante saber cuál método es el más recomendado para estimar parámetros y esto depende del modelo en cuestión. La prueba de bondad de ajuste más común es la (Ji) Cuadrada, (Steel et al. 1997), mientras que Sokal y Rolhf (1995) sugieren emplear la prueba de G en vez de la Ji-cuadrada. Una tercera prueba, no paramétrica, es la prueba Kolmogorov-Smirnov.

 

4. Temas Relacionados

 

5. Bibliografía

 Sokal, R.R., and F.J. Rohlf. 1995. Biometry. Freeman. New York.

Steel, R.G.D., J.H. Torrie, and D.A. Dickey. 1997. Principles and procedures of statistics. A Biometric approach. McGraw-Hill Co. New York.

 

Ċ
José López-Collado,
16 de feb. de 2012 8:11
Ċ
José López-Collado,
9 de feb. de 2012 5:58
Comments