Fases de un estudio estadístico

La Estadística es una parte de las matemáticas que permite hacer predicciones sobre fenómenos reales de prácticamente cualquier campo del saber humano.

Estas predicciones se elaboran generalmente a partir de la observación de un pequeño subconjunto de la población total objeto de estudio, con las ventajas que ello conlleva.

La Estadística permite hacer modelos de la realidad y decidir sobre la bondad de los mismos mediante métodos bien definidos.

Sin embargo es una parte de las Matemáticas que tiene sus detractores (incluso dentro de las propias Matemáticas). La polémica que generan sus métodos se debe, generalmente, a un escaso conocimiento de los mismos o a la facilidad con la que se prestan a la manipulación.

Suele decirse, como ejemplo de la simplificación que suponen ciertos datos estadísticos, que si una persona tiene su cabeza dentro de un horno y los pies en una nevera, su cuerpo podría estar a una temperatura media ideal.

También hay quien considera la Estadística como un ingenioso conjunto de falacias. Es célebre la frase de Benjamín Disraeli, primer ministro de la Reina Victoria, en la que afirmaba que existían “mentiras, grandes mentiras y estadísticas”.

A pesar de estos inconvenientes, no tenemos problema en aceptar como buenas las conclusiones estadísticas que nos convienen o nos resultan útiles, como análisis de sangre, nota media en el Instituto...

Muestras de sangre

Fases de un estudio estadístico

Las fases que se presentan a continuación no siempre se realizan en orden cronológico estricto, ni se agotan exhaustivamente antes de pasar a la siguiente. Sólo dan una idea de todas las etapas por las que pasa un estudio estadístico. Esta lista de etapas tampoco se muestra siempre de la misma manera. Encontrarás lugares donde el planteamiento del problema se divide en varias etapas, a su vez, por poner un ejemplo.

Planteamiento del problema

Un estudio estadístico comienza con un problema al que dar solución, con una pregunta a la que dar respuesta. ¿Cuánto debe una empresa aseguradora cobrar por un seguro para una moto? ¿Existirán diferencias entre los colores favoritos de los chicos y de las chicas?

En esta etapa se formulan hipótesis, se declaran formalmente los objetivos, y se delimita el el ámbito de aplicación, esto es, la población (population) objeto del estudio.

También queda clara aquí, aunque sea de forma implícita, el tipo de variable (variable) que se considerará.

Determinación de la muestra

A partir de la población objeto de estudio se elige una pequeña porción sobre la que se extraerán los datos.

Muestra

Aquí puedes aprender algo más sobre esta etapa.

Recogida de datos (collecting data)

En este momento se elabora la herramienta para la recogida de los datos que se necesitan para el estudio. Generalmente se trata de un cuestionario, aunque hay otros métodos.

Si se van a realizar preguntas, hay que preparar una tabla con las posibles respuestas, preparada para facilitar el recuento posterior.

Aquí puedes ver como ejemplo el cuestionario que hicimos en la introducción del tema.

A continuación se muestra un ejemplo de tabla para la recogida de respuestas:

    1. ¿Dónde estuviste de vacaciones el verano pasado?

En primer lugar hay que tener en cuenta si el conjunto de respuestas abarca todas las posibilidades. Por ejemplo, podría ocurrir que un encuestado haya estado visitando a sus familiares en otra ciudad. ¿Qué respuesta se ajustaría mejor a esa situación? No la hay.

Como a veces no es fácil o posible contemplar todas las opciones posibles, es bueno reservar una respuesta del tipo "Otros" o "No Sabe o No Contesta".

Así, la tabla anterior quedaría mejor planteada como sigue:

    1. ¿Dónde estuviste de vacaciones el verano pasado?

A medida que vamos realizando el estudio, vamos cumplimentando la tabla con la ayuda de la columna "Recuento" . Es más fácil para seguir trabajando que anotar los datos en una ristra, como vimos con el ejemplo de los colores favoritos.

Las columnas "Frecuencia" y "%" las podemos cumplimentar más adelante, con ayuda del ordenador.

    1. ¿Dónde estuviste de vacaciones el verano pasado?

Tratamiento de datos (tablas y gráficas)

En esta fase se suele usar el ordenador (la hoja de cálculo como programa es una buena opción) para el cálculo de frecuencias, porcentajes, totales...

A esta fase ya suele dársele publicidad e incluye una primera etapa de ordenación y depuración de errores (de transcripción, de medición...); la elaboración de tablas que resuman toda la información recogida y la presentación de esta información de modo más atractivo.

Ya conoces esta fase de otros cursos, frecuencias absolutas, relativas, porcentajes, totales, columnas adicionales... Para repasar puedes hacer los siguientes ejercicios.

Ejercicios

Ejercicio: En una encuesta se han recogido las siguientes respuestas sobre el peso de las personas encuestadas. Ordena los datos escogiendo un formato apropiado y depurando errores. Disponlos en una tabla agrupándolos en intervalos de 10 kg de amplitud.

56 54 55 70 54 i dont know 55kg 46 49kg 46 49 60 78 75 kg 56 kg 53 60 49 52 90 51 47 65 72 70 80 75 65

Ejercicio 2: Haz lo mismo con la siguiente tabla recogida para la pregunta Do you have any pet?

Dog, Hamster, mouse or other rodent

Reptiles

Bird

Dog

No one

Dog, Hamster, mouse or other rodent, Reptiles

Fish

Fish

No one

No one

Hamster, mouse or other rodent

No one

Dog

Dog

Cat

Cat

Dog, Hamster, mouse or other rodent

Hamster, mouse or other rodent

Dog, Cat, Bird, Reptiles

Bird, Fish

Hamster, mouse or other rodent

Dog

No one

Dog

Dog, Cat

Hamster, mouse or other rodent

Dog

Dog

Dog, Reptiles

Hamster, mouse or other rodent, Fish

No one

Ejercicio 3: Busca una forma de clasificar las siguientes profesiones y ordénalas en una tabla.

Police Officer, Criminologa, journalist or social sciences' teacher, psycology, i dont know, pediatrician, Teacher of physical education, economist, nurse, vet, mathematics teacher, football coach, bussines man, I don't know, I don´t know, vet, doctor, I don't know maybe chemist or maths teacher, psycollogist, movie director, actress, astrophysicist/engineer, doctor, midwife, fisioterapeuta, psycologist, lasagna.

Cálculo de parámetros

En esta etapa se realiza una mayor simplificación, resumiendo todos los datos recogidos con uno o unos pocos números.

Estos números son de distinto tipo y el más conocido es la media aritmética. Permiten, por ejemplo, hacer comparaciones entre distintas poblaciones o dentro de una misma población en distintos momentos.

Aquí tienes un página dedicada exclusivamente a esta fase del estudio estadístico.

Conclusiones e inferencias

Créditos de las imágenes

  1. Cajetilla: lambrus.blogspot.com.es

  2. Muestras: Wikipedia.