Tablas y gráficas (Análisis crítico)

Tablas

Se supone que a estas alturas de la ESO ya sabes tomar un conjunto determinado de datos recogido con fines estadísticos, elaborar una tabla que resuma la información y dibujar una gráfica que muestre de forma atractiva la información.

Mascotas

Así pues, en este apartado nos centraremos en el uso de software para simplificar este tedioso proceso y en el análisis crítico de las informaciones estadísticas presentadas en los medios de comunicación.

De todos modos, si necesitas repasar algo, puedes practicar con los siguientes ejercicios. Antes, recuerda que las tablas estadísticas suelen contener columnas para los valores de la variable, para las frecuencias y porcentajes, filas con los totales de cada uno de los anteriores y cuantas columnas adicionales sean precisas para el cálculo de parámetros.

  1. Elabora una tabla que resuma las siguientes ristras de datos recogidas en un cuestionario online:
    1. Edad: 15, 16, 16, 16, 16, 14, 16, 15, 15, 14, 15, 16, 16, 15, 15, 16, 15, 15, 16, 15, 16, 15, 16, 15, 15, 16, 15, 16, 16, 17, 17, 16.
    2. Colour (Girls): Purple, Blue, Purple, Blue, Pink, Blue, Blue, Pink, Blue, Blue, Pink, Blue, Purple, Pink, Pink, Blue.
    3. Colour (Boys): Blue, Yellow, Blue, Red, Green, Green, Yellow, Green, Blue, Green, Blue, Red, Green, Red, Blue, Blue, Orange.
    4. Número de hermanos: 2, 3, 2, 2, 2, 1, 3, 2, 2, 1, 1, 1, 2, 3, 1, 2, 2, 2, 2, 2, 1, 2, 4, 5, 3, 1, 2, 3, 4, 4, 1, 1.
    5. Tiempo en llegar al instituto (min.): 20, 30, 40, 15, 30, 20, 25, 25, 30, 15, 20, 15, 35, 15, 40, 30, 15, 20, 20, 15, 15, 15, 15, 25, 30, 30, 15, 20, 12, 40. Nota: tienes que agrupar los datos en intervalos.
    6. Favourite subject: Social Sciences, Religion, Social Sciences, Social Sciences, Mathematics, English, Religion, Nature Sciences, Physical Education, Social Sciences, Music, Social Sciences, Mathematics, Physical Education, Social Sciences, Religion, Social Sciences, Social Sciences, Nature Sciences, English, Visual and Manual Arts, Mathematics, Nature Sciences, Physical Education, Nature Sciences, Nature Sciences, Nature Sciences, Mathematics.

Gráficas

Las gráficas más comunes en estadística son:

Barómetro electoral en mayo de 2013 (Fuente: Metroscopia)

Barómetro electoral en mayo de 2013 (Fuente: Metroscopia)

En esta página tienes unos cuantos gráficos que resumen la información recabada en el cuestionario inicial del tema.

Errores y manipulaciones en el uso de tablas y gráficas.

No es raro observar como en la publicidad, los medios de comunicación o la política se utilizan unos mismos datos estadísticos para obtener conclusiones distintas. Una subida de precios o del índice de paro puede parecer más o menos acentuada según quién presente la información; un índice de audiencia o el colesterol que porta un determinado alimento puede parecer más o menos alto según con qué se lo compare; las llamadas telefónicas parecen ser más baratas en cualquier compañía... La lista de ejemplos es interminable.

Una buena formación matemática nos mantendrá atentos a estos excesos. De este modo, la estadística, además del papel instrumental que has conocido hasta ahora, tiene un importante papel en el desarrollo del pensamiento crítico.

A continuación veremos cuáles son los errores más frecuentes, aunque a veces, como ya se ha comentado, no se trata de errores, sino de manipulaciones tendenciosas.

Errores en la obtención de datos

Limitaciones humanas o de los instrumentos

Desde luego, todo experimento en el que se realizan mediciones acarrea errores debidos a las limitaciones humanas. Esto es irremediable en la mayoría de las ocasiones. Es imposible, por ejemplo medir la estatura de una persona con infinita precisión. Pero incluso en estudios exahustivos, como los censos, se estima que los errores afectan a un 2% del total de los datos.

Este error es inevitable en muchos casos.

Cuestionarios mal planteados

Un cuestionario está mal planteado si no se recogen todas las posibles respuestas, si la pregunta influye en la respuesta, si se presentan alternativas que no son tales, etc.

Las preguntas no deben contener juícios de valor y las diferentes opciones de respuesta deben ser equilibradas.

¿No es cierto que nuestro malvado profesor de Matemáticas pone los exámenes más difíciles de lo que dice que serán el día anterior? Sería un ejemplo de pregunta que contiene juicios de valor y es poco clara.

Las diferentes respuestas deben estar equilibradas:

A veces No

Es un ejemplo de respuestas poco equilibradas.

y el orden de presentación de las respuestas no debe ser influyente.

El conjunto de respuestas posibles puede hacer que haya duplicaciones u omisiones.

Incurrir en este error, deliberadamente o no, deja a individuos de la población sin representación entre las respuestas y, por lo tanto, los resultados que salgan del estudio estarán sesgados.

Las modalidades de la variable deben ser incompatibles y exhaustivas.

Si preguntamos por el color favorito y ofrecemos como posibles respuestas "Rojo", "Azul" o "Verde", dejamos sin poder responder a quienes escojan otro color. Si no estamos interesados en otros colores, podemos incluir un apartado llamado "Otro".

Delimitación imprecisa de la población

Hay individuos que no se sabe si pertenecen o no a la población.

Por ejemplo, si se desea estudiar si los niños andaluces ven demasiado la televisión, habrá que dejar claro qué edades en concreto se considerarán, si entendemos por andaluz a cualquier residente o sólo a los nacidos aquí, etc.

Selección de la muestra inapropiada

La muestra no representa a la población o se ha extraído por comodidad o de forma tendenciosa.

Muestra no representativa

La muestra debe contener toda la variabilidad de la población que pudiese influir en el estudio.

Si estudiamos los gustos televisivos de los adolescentes de un instituto y pensamos que estos gustos pueden variar en función de la edad, en la selección de la muestra deben escogerse edades variadas, a poder ser, en la misma proporción en la que se presentan en el instituto. Si, pongamos por caso, un 30% de los alumnos del instituto son de 1º de ESO, en una muestra de tamaño 30, un 30% de los encuestados, esto es, 9 alumnos, tendrían que ser de 1º de ESO.

Además, la elección de los individuos concretos que forman parte de la muestra debe hacerse de forma aleatoria.

Errores en las tablas

  • Los datos no están ordenados.
  • Elección de intervalos no acotados ("más de..."). Impiden el cálculo de ciertos parámetros.
  • Evitar ambigüedades en los extremos de los intervalos para variables continuas.
Tabla mala

En esta tabla no se sabe dónde están los que tardan 15 o 30 minutos.

Errores en las gráficas

  • En los diagramas de barras falta el origen, están truncados.
Asignatura favorita
    • En ambas tablas los porcentajes son los mismos (27 % prefiere Sociales, algo menos del doble que el 15 % que prefiere Mates). Sin embargo en la primera gráfica (que es precisamente la que la hoja de cálculo de Google ofrece por defecto) el porcentaje de preferencias de las Sociales sobre las Mates parece ser siete u ocho veces mayor.
  • Se aumenta o disminuye la escala en los ejes para aumentar o disminuir las diferencias aparentes entre las barras.
Minutos al Instituto
  • Ambas gráficas son técnicamente correctas, pero varía la escala. En la segunda se da la impresión de que no hay diferencias notables entre los valores de la variable. Pero se oculta, eso sí, que cada línea horizontal representa 50 minutos, mientras que en la primera gráfica la distancia entre cada línea es de 5 minutos. Según interese aumentar las diferencias o camuflarlas, puede jugarse con la escala en el eje vertical.
  • No se dejan claras las variables que se miden. Conviene escribirlas en los ejes.
  • En los pictogramas no se deja claro si la frecuencia es proporcional a la longitud del dibujo o a su superficie.

Errores en los parámetros

  • Dar el dato sin el total o sin compararlo con otros.
    • Ahorra un 30 % comprando este producto. (Ahorras respecto a una anterior versión del producto, respecto a productos similares de la competencia, respecto otra forma de empaquetado del mismo producto...).
  • La media no es representativa (poblaciones heterogéneas).
  • La media se ve afectada por valores muy grandes.
  • Asignación inapropiada de indecisos.
  • Cálculos erroneos.
  • Confusión entre media y mediana.

Peso (kg): 56, 54, 55, 70, 54, 55, 46, 49, 46, 49, 60, 78, 75, 56, 53, 60, 49, 52, 90, 51, 47, 65, 72, 70, 80, 75, 65.

La hoja de cálculo en estadística.