Licencia

Propietarios del sitio

  • Antonio Expósito

4.3. Tablas de frecuencias


Una vez realizado el experimento y tomados los datos, nos encontramos con una serie de resultados difícil de analizar. Un primer paso es ordenar esos datos en una tabla que nos haga tener un visión más clara de cómo están distribuidos éstos.
A éstas tablas se les llama tablas de frecuencias y su construcción va a depender del tipo de variable que estemos utilizando.
Definiremos primero las distintas frecuencias y incluiremos en la tabla.
  • Frecuencia absoluta: Número de veces que se presenta el valor de la variable. Habitualmente se representa como ni.
  • Frecuencia relativa: Cociente entre la frecuencia absoluta y el número total de casos. La representaremos como fi. La frecuencia relativa nos da el tanto por uno relativo a ese valor.
  • Porcentaje: Resultado de multiplicar por 100 la frecuencia relativa. Representado por pi, indica el tanto por ciento de la población que corresponde a ese valor de la variable.
  • Frecuencia absoluta acumulada: Suma de las frecuencias absolutas de todos los valores menores o iguales que el correspondiente valor de la variable. Representada como Ni.
  • Frecuencia relativa acumulada: Cociente de la frecuencia absoluta acumulada y el número total de casos. También se puede obtener sumando las frecuencias relativas de todos lo valores menores o iguales que el correspondiente de la variable. La representaremos como Fi.
  • Porcentaje acumulado: Resultado de multiplicar por 100 la frecuencia relativa acumulada. Lo representamos como Pi, y también los podríamos obtener acumulado los porcentajes.
Las frecuencias y porcentajes acumulados solamente se incluyen en el caso de trabajar con variables cualitativas ordenables y cuantitativas.
De esta forma una tabla de frecuencias completa quedaría de la siguiente forma:
 xi
 ni
 fi
 pi
 Ni
 Fi
 Pi
 x1
 n1
 f1
 p1
 N1
 F1
 P1
 x2
 n2
 f2
 p2
 N2
 F2
 P2
 x3
 n3
 f3
 p3
 N3
 F3
 P3
 ...
 ...
 ...
 ...
 1
 100
 
 N
 1
 100
 
 
 
  • "La suma de las frecuencias absolutas es el número total de datos"
  • "La suma de las frecuencias relativas es igual a 1"
  • "La suma de los porcentajes es igual a 100"

 

 CUALITATIVA NO ORDENABLE
PAÍS Nº automóviles Porcentaje

ALEMANIA

67.500 25.52% 

FRANCIA

44.327 16.76%

ESPAÑA

53.897 20.38%

ITALIA

37.011 14.00%

GRAN BRETAÑA

46.345 17.53%

HOLANDA

15.332 6.79%

TOTAL

264.412 100% 

Ventas de automóviles en el último año

CUALITITIVA ORDENABLE 
 
NIVEL ni   fi  pi  Ni Fi   P
Sin estudios  7 0.14 14% 7 0.14 14% 
Primarios 13 0.26 26% 20 0.40 40%
Secundarios 25 0.50 50% 45 0.90 90%
 Superiores 5 0.10 10% 50 1 100% 
   50  1 100%       

Nivel de estudios de 50 empleados de uan empresa

CUANTITATIVA DISCRETA
 Xi  ni  fi  pi Ni  Fi   Pi
0 20 0.10 10% 20 0.10 10%
1 80 0.40 40% 100 0.50 50%
2 60 0.30 30% 160 0.80 80%
3 30 0.15 15% 190 0.95 95%
4 10 0.05 5% 200 1 100%
  200 1 100%      
 
Número de hijos de las 200 familias de una localidad
CUANTITATIVA CONTINUA
 
 INTERVALO  ni fi  pi  Ni  Fi   Pi
[34.0-34.2) 2 0.042 4.2% 2 0.042 4.2%
[34.2-34.4) 9 0.188 18.8% 11 0.229 22.9%
[34.4-34.6) 5 0.104 10.4% 16 0.333 33.3%
[34.6-34.6) 7 0.146 14.6% 23 0.479 47.9%
[34.8-35.0) 9 0.188 18.8% 32 0.667 66.7%
[35.0-35.2) 5 0.104 10.4% 37 0.771 77.1%
[35.2-35.4) 9 0.188 18.8% 46 0.958 95.8%
[35.4-35.6) 2 0.042  4.2% 48 1  100%
  48  1  100%      

Longitud (mm) de las piezas fabricadas por una máquina a lo largo del un día.

 

 ALGUNAS CONSIDERACIONES A TENER EN CUENTA PARA VARIABLES CUANTITATIVAS CONTINUAS:
  1. Los intervalos deben estar acotados. Deben excluirse intervalos del estilo "menos de ...", "más de ...", ya que ésto dificulta la obtención de algunas de las medidas de centralización y dispersión.
  2. El extremo inferior de un intervalo debe coincidir con el superior del intervalo anterior. Habitualmente se utiliza el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha: [a,b) está incluido el punto a pero no el b, que pertenecerá al intervalo siguiente.
  3. Debe existir un número apropiado de intervalos. Si existen pocos intervalos se pierde gran información que nos impediría apreciar la distribución de la variable. Si existen demasiados se pierde la utilidad de usar agrupaciones por intervalos. Existen distintos criterios para establecer el número adecuado de intervalos, según Norcliffe el número de intervalos debe ser aproximadamente la raíz cuadrada del número de datos (para 100 datos, deberíamos tener aproximadamente 10 intervalos).
  4. La amplitud de los intervalos debe ser la misma. Ésto facilitará el cálculo de algunos parámetros y la representación gráfica. Sturges propone que la amplitud del intervalo debe ser aproximadamente "Recorrido/(1+3.32 log N)"
  5. Notaremos el extremo inferior del intervalo como Li y el extremo superior como Li+1. Para algunos cálculos usaremos como representante del intervalo lo que llamamos "marca de clase", el punto medio del intervalo.