Parámetros estadísticos

Proporción

El parámetro más frecuente en estadística se llama proporción. Se ofrece en forma de porcentaje y puede calcularse para todo tipo de variables. Trata de resumir la frecuencia de determinado valor de la variable en relación al total del que se ha extraído.

Proporción

Como ves, a veces una proporción está camuflada en forma de razón:

Perro

Uno de cada dos alumnos tiene un perro en casa.Moda

La moda es el valor de la variable más frecuente, el que más se repite, el que tiene mayor frecuencia absoluta. Es el parámetro más sencillo de calcular y puede extraerse también en todo tipo de variables.

Está íntimamente relacionado con el anterior, las proporciones, en el sentido de que es el valor que se presenta en un mayor porcentaje, el más alto en su proporción.

Moda

En cierto modo, la moda tiene mucho que ver con su significado cotidiano. Decimos que algo está de moda cuando lo usa, lleva o dice mucha gente.

¿Estarán de moda en el sentido matemático estas zapatillas?

El retrato robot del parado (modas y proporciones para describir este problema social).

Media aritmética

La media es un valor de la variable que marca su punto de equilibrio. Resume todos sus valores recogidos en uno solo.

Moda

La media aritmética permite comparar fácilmente dos poblaciones. Por ejemplo, los alumnos de 4º y los de 3º; los alumnos de 4º del Fray Luis y los de 4º de otro centro; o los alumnos de 4º de este curso y los del curso pasado.

Su cálculo se puede hacer sólo para variables cuantitativas. Se realiza sumando todos los valores y dividiendo por el número total de valores recogidos.

Observa este dato:

fruta

El alumnado de 4º toma 1,4 piezas de fruta al día como media.

Quizás pueda alguien tomarse una fruta y parte de otra, pero una media aritmética no representa un valor particular.

Mediana

La mediana es el valor de la variable que deja a tantos individuos por detrás de sí mismo como por delante, cuando todos los valores están ordenados.

Por ejemplo, en el caso de las estaturas de un grupo de personas, la estatura mediana sería la correspondiente a la persona que quedase en medio una vez que estas se ponen en fila, desde la más baja hasta la más alta.

Mediana

La línea roja muestra la estatura mediana de este grupo de muñecos.

Para una serie de números es sencillo encontrar la mediana. Primero se ordenan y luego se identifica el que está en medio.

Por ejemplo, el número de televisores en casa de los alumnos de 4º de ESO, según se recogió en el cuestionario inicial son:

2, 4, 2, 3, 3, 3, 4, 2, 3, 2, 1, 5, 4, 3, 3, 2, 1, 1, 4, 1, 2, 5, 1, 1, 2, 2, 1, 5, 5, 1, 2

Esos 31 números ordenados de menor a mayor quedan

1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5

y dejan en medio al número 2.

1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5

Pues ese valor, precisamente, es la mediana. Su interpretación es la siguiente: alguien con dos televisores tiene tantos compañeros con más televisores que él en casa que con los mismos o menos.

Cuando los datos están dispuestos en una tabla ordenada, es como si los tuviésemos ya contados, así que sólo hay que ir acumulando las frecuencias de cada valor de la variable hasta superar la mitad de los valores.

Mediana (tabla)

Percentiles

Un padre va al pediatra con su hijo de tres años a una visita rutinaria "de niño sano", que le dicen. El pediatra lo mide y lo pesa y le dice al padre "su hijo tiene un peso normal para su edad, pero su estatura está en el percentil 97". ¿Entiendes esa frase?

Un percentil es un valor cuyo cálculo se parece mucho a la mediana pero, en lugar de dejar por debajo de sí al 50% de la población, lo hace con otro porcentaje. Así, el percentil 75 sería el valor de la variable que deja por debajo de sí al 75 % de las observaciones.

En el ejemplo de la tabla anterior, el 75 % de 31 es 23,25. Si ordenásemos las observaciones (los números de pie) de menor a mayor, el número que dejaría por debajo de sí al 75 % de los datos sería el que está algo más allá de la posición 23, esto es, el número que hace el lugar 24. Observando la tabla de frecuencias comprobamos que este puesto correspondería a una de las tallas 44.

La interpretación de este dato es la siguiente: alguien con el número 44 de pie sabe que tiene por debajo de sí al 75 % de los números de pie de la clase.

Cuando se calcula el percentil en el que se encuentra la estatura de un niño (o cualquier otra variable que se esté midiendo) es como si tuviésemos todas las medidas de todos los niños de esa época y zona y estuviésemos situando al niño en su posición, una vez que todos estén ordenados de menor a mayor. Si decimos, como aparece arriba, que el niño está en el percentil 97, significa que está entre los más altos de la población, que de cada 100 niños con sus características, sólo encontrará 3 más altos que él.

A continuación puedes ver las tablas de percentiles para chicas y chicos que se usan en pediatría. Haz clic en las imágenes para verlas más grandes.

Percentiles Chicos
Percentiles Chicas

Calcula en qué percentil te encuentras.

Las tablas de frecuencias absolutas acumuladas ayudan al cálculo de percentiles porque indican, precisamente, en qué percentil se encuentra cada valor de la

Ejercicios

  1. Revisa el vídeo de la introducción, detecta todos los parámetros que aparecen y clasifícalos entre los que acabamos de describir.
  2. Calcula el peso medio del alumnado de tu clase. Los pesos recogidos son: 56, 54, 55, 70, 55, 54, 49, 46, 46, 75, 56, 49, 60, 78, 90, 53, 60, 49, 52, 51, 47, 65, 72, 70, 80, 75, 65.
  3. Observa las siguientes estaturas de una muestra aleatoria del alumnado de 1º de ESO de este centro (curso 2012-2013): 154, 157, 165, 162, 162, 155, 155, 167, 157, 159, 152, 168, 168, 170, 162, 168, 160, 175, 150, 145, 140, 155, 155, 167, 155, 140, 140, 150. Responde de un modo científico a esta pregunta ¿son más altos los chicos y chicas de 4º de ESO que los de 1º de ESO?

Parámetros de dispersión

Hay veces que los parámetros anteriores no dan suficiente información sobre la distribución de datos, porque esta no es suficientemente homogénea.

Por poner un ejemplo sencillo: supongamos que un estudiante A obtiene un 0 en la primera evaluación, un 5 en la segunda y un 10 en la tercera. Un segundo estudiante, B, saca, sin embargo, un 5 en cada una de las evaluaciones. Ambos tienen una nota media de 5: (0+5+10)/3 = (5+5+5)/3 = 5 aunque es evidente que el curso ha transcurrido de manera diferente para ambos.

El ejemplo clásico que comentábamos al principio del tema sobre la temperatura media ideal de alguien con la cabeza en un congelador y los pies en un horno es otra muestra de cómo la media o, en general, un parámetro de centralización como los vistos más arriba pueden ser excesivamente simplificadores en determinadas distribuciones de datos.

Los parámetros de dispersión miden, precisamente, lo diferentes o parecidos que son los datos de la variable entre sí. De este modo, si la población es homogénea respecto a la variable que se pretende medir, se dice que tiene poca dispersión (todos los valores de la variable son muy parecidos). Si, por el contrario, hay grandes variaciones entre los valores, se habla de una gran dispersión.

Rango

Es el parámetro más sencillo y el que menos información da. Se calcula haciendo la diferencia entre el mayor valor de la variable y el menor valor.

En el ejemplo de los estudiantes, el rango de notas del estudiante A es 10 - 0 = 10, mientras que el rango del B es 5 - 5 = 0.

Varianza y desviación típica

Son los más importantes y los más usados en estadística. Aunque no es exactamente así, puedes pensar en la desviación típica (o desviación estándar) como en una media de las diferencias entre todos los valores y su media aritmética.

Para calcularla, se resta a cada valor de la variable, la media aritmética. Esos resultados se elevan al cuadrado y se hace, a su vez, la media aritmética de todos ellos. Finalmente, se extrae la raíz cuadrada.

La varianza es el cuadrado de esa desviación típica, es decir: la media de los cuadrados de las diferencias entre cada valor y la media aritmética.

La desviación típica está medida en las mismas unidades que la variable. Tiene algunas propiedades muy interesantes como:

  • En el intervalo están, al menos, el 75% de los datos.
  • En el intervalo están, al menos, el 89% de los datos.

Donde x es la media aritmética y s la desviación típica.

Diagrama de Caja con Bigotes

Una forma gráfica de visualizar la dispersión de los datos es el diagrama de caja con bigotes o "Box and Whiskers".

En esta web puedes aprender cómo se calcula, además de algunas interpretaciones.

Has de tener en cuenta que cuando se habla de los cuartiles Q1 y Q3 se están refiriendo, respectivamente, a los percentiles 25 y 75.