Definición: La estadística es una rama de las matemáticas que se ocupa de la recopilación, análisis, interpretación, presentación y organización de datos. Su objetivo es ayudar a entender y describir fenómenos a partir de datos cuantitativos y cualitativos.
Importancia: La estadística se utiliza en diversas áreas, como la economía, la sociología, la psicología, la biología, la medicina, entre otras.
Datos Cualitativos (o categóricos): Representan cualidades o características y se clasifican en categorías. Ejemplos: color de ojos, tipo de coche.
Subtipos:
Nominales: No tienen un orden lógico (ej. tipo de fruta).
Ordinales: Tienen un orden (ej. nivel de satisfacción: bajo, medio, alto).
Datos Cuantitativos: Representan cantidades y se expresan numéricamente. Ejemplos: altura, peso, edad.
Subtipos:
Discretos: Toman valores específicos y contables (ej. número de hijos).
Continuos: Pueden tomar cualquier valor dentro de un rango (ej. altura de una persona).
Las medidas de tendencia central son valores que representan un conjunto de datos y describen la posición central de estos.
Definición: Es el promedio de un conjunto de datos. Se calcula sumando todos los valores y dividiendo entre el número total de valores.
Fórmula: Media=∑i=1nxin\text{Media} = \frac{\sum_{i=1}^{n} x_i}{n}Media=n∑i=1nxi
Ejemplo: Para los datos 2,4,6,82, 4, 6, 82,4,6,8: Media=2+4+6+84=204=5\text{Media} = \frac{2 + 4 + 6 + 8}{4} = \frac{20}{4} = 5Media=42+4+6+8=420=5
Definición: Es el valor que ocupa la posición central en un conjunto de datos ordenados.
Cálculo:
Si nnn es impar: la mediana es el valor en la posición n+12\frac{n + 1}{2}2n+1.
Si nnn es par: la mediana es el promedio de los dos valores centrales.
Ejemplo: Para los datos 1,3,3,6,7,8,91, 3, 3, 6, 7, 8, 91,3,3,6,7,8,9 (7 datos):
Mediana = 6 (cuarta posición).
Para 1,2,3,4,5,61, 2, 3, 4, 5, 61,2,3,4,5,6 (6 datos): Mediana = 3+42=3.5\frac{3 + 4}{2} = 3.523+4=3.5.
Definición: Es el valor que aparece con mayor frecuencia en un conjunto de datos.
Ejemplo: En los datos 1,2,2,3,41, 2, 2, 3, 41,2,2,3,4, la moda es 222. Si los datos son 1,1,2,2,31, 1, 2, 2, 31,1,2,2,3, se dice que hay dos modas (bimodal).
Las medidas de dispersión indican cómo se distribuyen los datos respecto a la media.
Definición: Es la diferencia entre el valor máximo y el valor mínimo de un conjunto de datos.
Fórmula: Rango=Valor maˊximo−Valor mıˊnimo\text{Rango} = \text{Valor máximo} - \text{Valor mínimo}Rango=Valor maˊximo−Valor mıˊnimo
Ejemplo: Para los datos 3,5,7,103, 5, 7, 103,5,7,10: Rango=10−3=7\text{Rango} = 10 - 3 = 7Rango=10−3=7
Definición: Mide la dispersión de los datos respecto a la media. Es el promedio de las diferencias al cuadrado entre cada dato y la media.
Fórmula: Varianza=∑i=1n(xi−Media)2n\text{Varianza} = \frac{\sum_{i=1}^{n} (x_i - \text{Media})^2}{n}Varianza=n∑i=1n(xi−Media)2
Ejemplo: Para los datos 2,4,62, 4, 62,4,6 (Media = 4): Varianza=(2−4)2+(4−4)2+(6−4)23=4+0+43=83≈2.67\text{Varianza} = \frac{(2-4)^2 + (4-4)^2 + (6-4)^2}{3} = \frac{4 + 0 + 4}{3} = \frac{8}{3} \approx 2.67Varianza=3(2−4)2+(4−4)2+(6−4)2=34+0+4=38≈2.67
Definición: Es la raíz cuadrada de la varianza y proporciona una medida de la dispersión en las mismas unidades que los datos originales.
Fórmula: Desviacioˊn Estaˊndar=Varianza\text{Desviación Estándar} = \sqrt{\text{Varianza}}Desviacioˊn Estaˊndar=Varianza
Ejemplo: Usando el mismo conjunto de datos 2,4,62, 4, 62,4,6: Desviacioˊn Estaˊndar≈2.67≈1.63\text{Desviación Estándar} \approx \sqrt{2.67} \approx 1.63Desviacioˊn Estaˊndar≈2.67≈1.63
Histogramas: Se utilizan para mostrar la frecuencia de datos en intervalos.
Diagramas de Caja (Boxplots): Representan la mediana, los cuartiles y los valores atípicos.
Gráficos de Barras: Muestran datos cualitativos y su frecuencia.
Calcula la media de los datos 5,10,15,20,255, 10, 15, 20, 255,10,15,20,25.
Solución: Media=5+10+15+20+255=755=15\text{Media} = \frac{5 + 10 + 15 + 20 + 25}{5} = \frac{75}{5} = 15Media=55+10+15+20+25=575=15
Encuentra la mediana de los datos 8,3,7,5,128, 3, 7, 5, 128,3,7,5,12.
Solución:
Primero ordenamos: 3,5,7,8,123, 5, 7, 8, 123,5,7,8,12.
La mediana es 777 (tercer dato).
Encuentra la moda de los datos 4,1,2,4,3,4,5,24, 1, 2, 4, 3, 4, 5, 24,1,2,4,3,4,5,2.
Solución: La moda es 444 (aparece 3 veces).
Encuentra el rango de los datos 10,20,15,5,3010, 20, 15, 5, 3010,20,15,5,30.
Solución: Rango=30−5=25\text{Rango} = 30 - 5 = 25Rango=30−5=25
Calcula la varianza y desviación estándar de los datos 4,8,64, 8, 64,8,6.
Solución:
Media = 4+8+63=6\frac{4 + 8 + 6}{3} = 634+8+6=6.
Varianza:
Varianza=(4−6)2+(8−6)2+(6−6)23=4+4+03=83≈2.67\text{Varianza} = \frac{(4-6)^2 + (8-6)^2 + (6-6)^2}{3} = \frac{4 + 4 + 0}{3} = \frac{8}{3} \approx 2.67Varianza=3(4−6)2+(8−6)2+(6−6)2=34+4+0=38≈2.67
Desviación estándar: 2.67≈1.63\sqrt{2.67} \approx 1.632.67≈1.63.