Hasta el momento, hemos explorado estadísticas descriptivas y distribuciones de probabilidad, fundamentales para describir poblaciones. Ahora, pasamos a la Inferencia Estadística, que se centra en la toma de decisiones o predicciones acerca de parámetros, las medidas numéricas que caracterizan a una población.
La inferencia estadística ofrece diversas formas de tomar decisiones o hacer predicciones, algunas subjetivas y otras objetivas. ¿Qué tan acertadas son estas predicciones o decisiones? La inferencia estadística nos ayuda a responder esta pregunta. Se ocupa de tomar decisiones o realizar predicciones acerca de parámetros poblacionales, como la media poblacional (m), la desviación estándar poblacional (s) y la proporción binomial poblacional (p).
Los métodos de inferencia estadística se dividen en dos categorías principales: estimación y prueba de hipótesis. La estimación consiste en predecir o estimar el valor de un parámetro, mientras que la prueba de hipótesis implica tomar una decisión sobre el valor de un parámetro basada en una idea preconcebida sobre su posible valor.
Para estimar el valor de un parámetro poblacional, se utilizan estimadores, reglas o fórmulas que calculan una estimación basada en la información de la muestra. Los estimadores pueden ser de dos tipos: de estimación puntual, donde se calcula un solo número para estimar el parámetro, y de estimación de intervalo, donde se calculan dos números para formar un intervalo que se espera contenga el parámetro.
Un estimador puntual calcula un solo número para estimar el parámetro poblacional, mientras que un estimador de intervalo calcula dos números para formar un intervalo dentro del cual se espera que esté el parámetro.
Para seleccionar el mejor estimador, se utilizan distribuciones muestrales que deben tener ciertas características deseables. Por ejemplo, un estimador puntual deseable debe tener una distribución muestral centrada en el valor verdadero del parámetro, lo que significa que no debe subestimar o sobreestimar consistentemente el parámetro.
Un estimador se considera insesgado si la media de su distribución es igual al valor verdadero del parámetro. Por otro lado, si la media de la distribución no es igual al valor verdadero del parámetro, se dice que el estimador está sesgado.
Finalmente, un estimador de intervalo es una regla para calcular dos números que forman un intervalo en el que se espera que esté el parámetro con cierto nivel de confianza, medido por el coeficiente de confianza, designado por (1 - a). Este coeficiente representa la probabilidad de que el intervalo de confianza contenga el parámetro estimado.
UN INTERVALO DE CONFIANZA DE MUESTRA GRANDE (1-a) PARA UNA MEDIA POBLACIONAL
donde z_{a/2}
es el valor z correspondiente a un área en la cola superior de distribución z normal estándar y un tamaño muestral n, desviación estándar sigma de la población muestrada
Si sigma es desconocida, puede ser aproximada por la desviación estándar muestral s
UN INTERVALO DE CONFIANZA DE MUESTRA PEQUEÑO (1-a) PARA UNA MEDIA POBLACIONAL
t_{a/2} es el valor t correspondiente a un área de en la cola superior de la distribución t de Student con (n-1) grados de libertad, un tamaño muestral n y una desviación estándar muestral s. Se considera un tamaño de muestra pequeño cuando es menor a 30.
Sea
{1.65,1.61,1.58,1.50,1.575,1.605,1.58,1.83}
una muestra de las estaturas de alumnos del grupo de estudiantes de maestría, hallar el intervalo de confianza para el promedio de estaturas del grupo para;
a) 95%, b)99% y c)90%
Estatura <- c(1.65,1.61,1.58,1.50,1.575,1.605,1.58,1.83)
mean(Estatura)
[1] 1.61625
sd(Estatura)
[1] 0.09624188
a)
mean(Estatura)+(qt(0.025,7)*sd(Estatura)/sqrt(7))
mean(Estatura)-(qt(0.025,7)*sd(Estatura)/sqrt(7))
b)
mean(Estatura)+(qt(0.005,7)*sd(Estatura)/sqrt(7))
mean(Estatura)-(qt(0.005,7)*sd(Estatura)/sqrt(7))
c)
mean(Estatura)+(qt(0.05,7)*sd(Estatura)/sqrt(7))
mean(Estatura)-(qt(0.05,7)*sd(Estatura)/sqrt(7))