La estadística descriptiva permite describir los resultados de cada una de las variables por separado.
En una investigación exploratoria o descriptiva, utilizaremos la estadística descriptiva con fin de nuestra investigación.
En una investigación correlacional o explicativa, la estadística descriptiva será el primer paso para describir las variables, antes de pasar a la estadística inferencial para el contraste de las hipótesis.
Según el tipo de datos podremos utilizar unos estadísticos y unas gráficas diferentes en el análisis de datos descriptivo.
Tanto para las variables nominales como para las ordinales utilizamos el análisis de frecuencias.
Las frecuencias absolutas recogen el número de veces concreto que aparece esa categoría en los datos. En la tabla se puede ver un ejemplo en una variable con 5 categorías: en la primera categoría habría 5 participantes, en la segunda 7, y así sucesivamente.
Las frecuencias relativas recogen el porcentaje que supone ese número de veces sobre el total de la muestra. En la tabla, en la columna correspondiente, se puede comprobar que los 5 sujetos de la categoría 1 corresponden al 16,6% de la muestra total, y así con cada categoría.
En los datos ordinales, además, se incluyen las frecuencias acumuladas, tanto absolutas como relativas, para mostrar la distribución de la muestra. Para ello, se suma el número de veces o el porcentaje de la categoría más las anteriores. No tendría sentido para variables nominales, ya que no establecen un orden y, por tanto, no tiene sentido sumar ese orden.
Por ejemplo, en la tabla, si sumamos los participantes que están en las dos primeras categorías para conocer su frecuencia absoluta acumulada, imaginemos que representan el grado de acuerdo con algo, diríamos que 12 personas no están de acuerdo porque están en los niveles 1 y 2, y sobre la frecuencia relativa acumulada, diríamos que el 39,9% de la muestra no está de acuerdo, sumando las frecuencias relativas de los niveles 1 y 2.
Respecto a las frecuencias relativas acumuladas, resulta interesante conocer otra serie de datos que nos permiten profundizar en la distribución de nuestra muestra.
Los centiles representan cada 1%, con lo que tendríamos un total de 100 centiles, de ahí su nombre.
Los cuartiles representan cada 25%, con lo que tendríamos un total de 4 cuartiles, de ahí igualmente su nombre.
Los deciles representan cada 10%, con lo que tendríamos un total de 10.
También podemos ofrecer los resultados de las variables nominales y ordinales a través de gráficos, de forma que se pueda comprobar visualmente estos resultados.
En las variables nominales podemos utilizar un gráfico de pastel o un gráfico de barras.
En las variables ordinales podemos utilizar un gráfico de barras, ya que el pastel no permite visualizar el orden de los niveles de la variable.
En el caso de las variables cuantitativas continuas, los estadísticos más adecuados serían utilizar la media como medida de tendencia central, y la desviación típica como medida de dispersión.
En el caso de las variables cuantitativas discretas, la media no es muy útil, pues los resultados tienen saltos que no reflejarían bien la distribución de tendencia central. Por ello, en el caso de las variables discretas es mucho más útil interpretar la moda, que será la puntuación que más se repite, y la mediana que será la puntuación que ocupa el valor central si ordenamos todos los datos de menor a mayor. La mediana corresponde con el centil 50, es decir, es el centro de la distribución de los datos.
En el caso de las variables discretas no es necesario conocer la variabilidad o dispersión de los datos.
En cuanto a los gráficos, para los datos discretos, podemos utilizar un gráfico de barras, unido a un polígono de frecuencias si nos parece oportuno.
El polígono de frecuencias une todas las barras a través de una línea que muestra la distribución, como vemos en el ejemplo del medio propuesto sobre un histograma.
Para los datos continuos, podemos utilizar un histograma, similar a un gráfico de barras, pero cuyas barras están todas unidas entre sí para representar todos los datos de forma continua, ya que la distribución de los datos es continua. También se puede añadir un polígono de frecuencias que una todas las barras del histograma.