La Varianza
La Varianza
Video Clase
Texto
La varianza es uno de los estadísticos más utilizados en la estadística después de la media se utiliza bastante, sus principales características son que la varianza es una medida de dispersión esto es diferente a la media porque la media es un promedio.
La varianza de mide la separación es distancia que tienen los datos por ejemplo acá entre 1 y 3 hay dos unidades de distancia entre 3 y 9 hay 6 unidades distancia a medios a través de apreciación, vamos a ver un ejemplo que nos ayude a entender mejor esta diferencia.
Por ejemplo tenemos 3 datos, tenemos a 24,44 y 82 = 3 datos y por el otro lado tenemos también 3 datos 49,50 y 51, si sumamos 24,44 y 82 =150, y si sumamos 49 + 50 + 51 también vamos a tener 150 esto lo dividimos entre 3 y tenemos una media de 50 para ambos grupos
Entonces la varianza es un coeficiente que mide la separación de los datos y esto es de bastante utilidad conforme lo vamos a ver entonces vamos a tener que la varianza es de 817 en cambio la desviación estándar es de 28 pero ahora qué diferencia hay entre varianza y dispersión estándar.
La desviación estándar es la raíz cuadrada que la varianza, la varianza muestral se denomina S al cuadrado y la desviación estándar simplemente es S, la media se simboliza con la X raya es una medida de tendencia central, diferente a la varianza y a la desviación estándar que son medidas de dispersión.
La varianza poblacional se mide con el símbolo sigma, la varianza la muestran con el símbolo con una S mayúscula lo vamos a ver en este ejemplo de las fórmulas de cómo se calcula y podemos ver que la varianza poblacional está con el símbolo Sigma estaba bien esta poblacional tiene la siguiente fórmula cada 1 de los elementos se resta de la media o del promedio elevando todo al cuadrado y dividiéndolo entre el número de datos ocurre con la varianza muestral como la única diferencia que en los números de datos se le resta 1 hacer una muestra es más pequeña que la población y cuando es más en la población que tiene más datos sabemos que hay mayor potencia para contrarrestar esto es una unidad, los datos con los que se va a dividir la hoy está en devastación al cuadrado que se ha realizado la varianza
Otra característica de la varianza elevada es artificiosa, porque es elevada al cuadrado la desviación estándar es la raíz cuadrada de la varianza entonces tenemos acá cuadrado y se elimina de raíz con esto con la raíz como la del cuadrado a la varianza que está elevada al cuadrado es mas voluminosa.
En cambio, la desviación estándar es más real porque ya sacaste la raíz, regresa a una normalidad entonces vamos a ver acá que la varianza tiene 817, en cambio la desviación estándar desde solo 28 y esto es más real más acorde a la separación de los datos que tenemos en esta serie la varianza y no utilizamos la desviación estándar.
En algunos casos en algunos casos utilizando la varianza cuando estamos con datos o valores que tienden a cero, la varianza nos da una mayor maniobrabilidad se puede decir inflado.
Entonces una característica de la varianza es aplicable a medidas cuantitativas y también ordinales, como la medida de la varianza en el Alfa de Cronbach por ejemplo tenemos la modificación de Alfa de Cronbach a veces es muy aceptable poco aceptable nada aceptable entonces normalmente son de 5 valores codificados informacional este juega un papel muy importante.
Vamos a ver ahora en cuanto a su aplicación la varianza se utiliza bastante para comparar datos referidos a máquinas por ejemplo, en control de calidad vamos a ver acá en este otro esquema que tenemos dos conjuntos de datos que han sido medidos a una máquina, tenemos que el primer dato que nos da es de 7, el segundo de 1, el otro de 5, el otro de 2, entre 7 y 1 y hay una distancia de 6, así sucesivamente tenemos distintas distancias y vemos que hay valores un poco altos por ejemplo entre 1 y 8 en la separación de 7 gráfico podemos ver que tiene un pico elevado, por otro lado tenemos un conjunto de datos de otra máquina donde estiman unos valores más pequeños vemos que la separación entre 3 y 1 es dos, entre 1 y 3 es dos, entre 3 y 2 es 1, y entre 2 y 1, 0 .Efectivamente son valores pequeños entonces qué nos hace esto, la máquina que tiene estos datos tiene estos datos de arriba tiene menor error, en general la mayor dispersión como estos datos como el caso de esta serie de abajo una falla un defecto porque es demasiado variable, entonces esta máquina está haciendo mal su trabajo por ejemplo si está haciendo empates en las cantidades del producto son muy dispersas, que sea verificada reparar esta máquina tiene una mayor precisión en los instrumentos documentales. Cuando hay una más alta dispersión entonces el Alfa de Cronbach nos indica que no es muy confiable el instrumento y requiere tomarse medidas para mejorarlo.
En cambio este si tenemos una dispersión baja el Alfa lo toma como si fuera bastante fiable, quiere decir con eso que busquemos todas las respuestas sean iguales, que no puede haberte demasiada disparidad, demasiadas diferencias que permita al estadístico, indicarnos que no se está entendiendo bien no se ha redactado bien las preguntas y algunas otros defectos que en la teoría nos indica.
Regresando a las utilidades que tiene la varianza es muy aplicada también en mediciones de riesgos en tendencias, conforme a la separación de datos y vamos a seguir viendo en el análisis espacial exploratorio confirmatorio diversas utilidades de la varianza.
Que quede bien claro que, la varianza es la varianza poblacional que es Sigma al cuadrado, este se divide entre el número de elementos que tiene en cambio la paciencia es la F al cuadrado, cuando tenemos el la desviación estándar simplemente si es poblacional es solamente el Sigma porque el cuadrado se anula con la raíz y si es muestral solamente tenemos la S mayúscula