Texto
Vamos a ver las medidas de dispersión, como vimos. La estadística descriptiva se divide en 3 ramas. Tenemos la estadística de tendencia central. Las medidas de dispersión y de distribución.
En esta oportunidad estamos viendo las medidas de dispersión, esto es la varianza, desviación estándar y rango, se denominan medidas de dispersión, justamente porque el estadístico busca medir la distancia entre los datos. Por ejemplo, acá tenemos un grupo de datos, una serie, donde lo que va a medir estas medidas es la distancia entre 2 y 4, entre cuatro y cuatro, que no hay distancia entre 4 y 6, y entre 6 y 8. Estas medidas son 3, la varianza, la desviación estándar.
¿Y el rango? Entre varianza y desviación estándar podemos decir que no hay mucha diferencia, la desviación estándar es igual a la varianza, sólo que se le saca la raíz cuadrada, nada más.
Para obtener el rango restamos el número mayor con el de menor tamaño, en este caso 8 – 2 serían 6. La fórmula para la varianza es la siguiente. Es la sumatoria de cada una de las X cada uno de los números menos el promedio, todo esto elevado al cuadrado y dividido entre el número de los datos menos 1. Eso es la varianza y la desviación estándar, le sacamos la raíz cuadrada para neutralizarla. La potencia. Y tenemos la desviación estándar.
La aplicación que tiene la desviación estándar y la varianza de repente en mayor. Medida es la desviación estándar, las más aplicable. Se utiliza en la ciencia, en la industria. Acá, por ejemplo, tenemos un conjunto de datos bastantes unidos, con poca separación entre 3 y 3. No hay separación entre 300, hay 1 solo de separación y así sucesivamente y vemos una desviación estándar. De 0.641. De varianza. En el segundo grupo de datos vemos que están más separados los números.
En botellas de 3 L una separación, una varianza de 0.6 podría de repente a ser aceptable, pero si es demasiado como este caso: 375 significaría un defecto que hay que corregir inmediatamente. Esto también ocurre en los instrumentos documentales. Cuando tenemos bastante separación entre las respuestas, los valores de las respuestas, el instrumento no es muy fiable.
Ahora vamos a ver esto como lo se da en la matriz de datos acá tenemos los mismos datos anteriores. Los tenemos en las columnas A y B, para ello nos vamos al menú analizar y estadísticos descriptivos, nos vamos a frecuencias, pasamos ambas variables acá al cuadro de variables in estadísticos.
Elegimos las medidas de dispersión como la desviación estándar, varianza, el rango acá tenemos medidas de tendencia central, los percentiles, pero ahora solamente nos interesa la desviación estándar, varianza, el rango, también vamos a ponerle el mínimo y el máximo para cada una de las series de datos.
Entonces nos encontramos con la variable A que tienen los valores de la desviación estándar de 0.6 varianza, 0.411. que no es muy dispersa, en cambio, la variable B si tiene una mayor dispersión en cuanto a la varianza en cuanto a la desviación estándar: 2.375.
En cuanto a la varianza, 5. 643. podemos ver una mayor amplitud en cuanto al rango en la primera variable, sólo dos de amplitud y en la variable B, 6 unidades de amplitud.
Entonces, el SPS nos ayuda a calcular cualquiera sea el número de datos que tengamos, y por lo general, no es siempre, pero por lo general una mayor amplitud en los datos puede significar el efecto de una máquina, un instrumento, o lo que estemos analizando.