El Ing. Mandujano

estadistica descriptiva

ESTADÍSTICA DESCRIPTIVA

Introducción:

El trabajo estadístico consta de varias fases. En la primera etapa se produce la recolección de numerosos datos, que tienen que organizar para que sea posible estudiarlos. De todo esto se ocupa la estadística descriptiva. La segunda fase consiste en la aplicación de los modelos matemáticos para obtener  conclusiones a partir de los datos. En una tercera fase se intenta extender conclusiones obtenidas de la poblaciones más amplias o bien hacer predicciones para el futuro. De esta tercera fase se ocupa la estadística inferencial.

Definición:

La estadística descriptiva se encarga de describir el comportamiento de los datos y presentarlos mediante, tablas, graficas y análisis con sus distintos momentos tanto para datos agrupados y no agrupados.

Primeras definiciones:

Se llama población al conjunto sobre el que se quiere investigar. Una población estadística puede estar formada por personas, pero también por aviones, baterías, y en general por cualquier tipo de objetos. De denomina tamaño de población estadística al número total de elementos de que consta.

De una población se pueden estudiar diversas características. Las características pueden ser cualitativas y cuantitativas.

La observación estadística puede ser exhaustiva, cuando se estudia toda la población, o parcial, cuando solo se estudia una parte de ella. Raras veces se realizan estudios estadísticos exhaustivos, ya que resultan demasiado laboriosos y sobre todo demasiado caros. Precisamente, el atractivo de la estadística consiste en poder observar una parte pequeña de una población y extender los resultados obtenidos al total de dicha población. A esta toma de datos se le llama muestra.

Para hacer el estudio o análisis de las muestras o poblaciones hay dos formas dependiendo del N° de datos.

Datos No Agrupados

Una colección de datos se dice que no es agrupado cuando es menor a 30 datos y están dispersos aleatoriamente (randorizados)  y para analizarlos e interpretarlo se cuenta con tres tipos de medidas de interpretación; las centrales, las de dispersión y las de posición.

 

Medidas de Tendencia Central

Media:

La media es el parámetro estadístico que nos presenta el promedio de todos los datos y que se obtiene con la sumatoria de todos tus datos divididos entre la totalidad

Mediana:

La mediana es la medida que representa el 50% de los datos geométricamente y para encontrarla debemos ordenar los datos en orden ascendente (de menor a mayor) y aquel que quede en medio es la mediana si acaso hubiesen dos datos se suman y se dividen entre 2.

Moda:

La moda es el dato que más frecuentemente se repite

Medidas de Dispersión o Variabilidad

Desviación estándar: es la variación que respecto a la media tiene los datos y se obtiene mediante la sumatoria de cada dato menos la media y esta diferencia al cuadrado  se divide entre n-1 y se saca la raíz cuadrada

Varianza: es el cuadrado de la desviación estándar es más fácil calcularla para obtener la desviación después.

Rango: es la diferencia del dato mayor menos el dato menor.

Coeficiente de variación: es la razón de la desviación estándar entre la media y esta

multiplicada por 100

Medidas de Posición

Percentil: es el dato que se encuentra a cierto porcentaje de los datos y cada percentil lo ubicamos con la formula.

Lp=((n+1)(p))/100

 

Cuartil: un cuartil es la cuarta parte  de la población y cda cuartil equivale a:

Q1=P25

Q2=P50=Mediana

Q3= P75

Rango Intercuartilico (RIQ)= Q3-Q1

 

Datos  Agrupados

Cuando la cantidad de los datos a analizar supera o iguala los 30 datos el procedimiento para su análisis se hace mediante tablas de frecuencia.

Para agrupar datos empleamos el concepto de frecuencia absoluta de un determinado valor, que se puede definir como el número de veces que se repite dicho valor. Además de la frecuencia absoluta existe la frecuencia relativa en la que basta de dividir cada frecuencia absoluta entre el tamaño y expresar el resultado en porcentaje.

Construcción de la Tabla de Frecuencias.         

 Para construir una tabla de frecuencias lo primero que hay que conocer es el numero de clases o de intervalos (las filas de la tabla)

a)    Los intervalos están dados arbitrariamente por el ejercicio

b)    Calculados

 

Forma 1:  

 

Forma 2: I=1.33lnu

 

Donde:

u= tamaño de la población o total de datos

 

Lo siguiente es calcular el rango que es la diferencia entre el valor mayor menos el menor

 

R=VM-vm

Para calcular la abertura del intervalo se divide el rango entre el numero de intervalos

A=(R/I)

Según el numero de decimales redondear de acuerdo a datos

Por ejemplo:

Si todos los datos son enteros se redondea al entero superior

Si todos los datos son decimales se redondea al decimal inmediato superior

Dado esto se construye la tabla como sigue:

Primera Columna (Clases)

Li(vm), Ls(Li+A)

Li(Ls anterior), Ls(Li+A

Li(Ls anterior), Ls(Li+A

Li(Ls anterior), Ls(Li+A

Li(Ls anterior), Ls(Li+A

Li(Ls anterior), Ls(Li+A)

 

Segunda Columna (Marca de Clase (xi))

Sumar los dos limites y dividirlos entre 2

(Li+Ls)/2

(Li+Ls)/2

(Li+Ls)/2

(Li+Ls)/2

(Li+Ls)/2

 

Tercera columna (Frecuencia (fi))

Anotar el numero de datos que se encuentre en cada intervalo

Fi

 

Cuarta columna (Marca de Clase por frecuencia (xifi))

Xifi

 

Quinta columna (Marca de clase menos la media (xi-µ))

(x-µ)

Sexta  columna (Marca de clase menos la media al cuadrado (xi-µ)2)

(x-µ)2

Séptima columna (Marca de clase menos la media al cuadrado por la frecuencia (fi (xi-µ)2)

fi(x-µ)2

 

Octava columna (frecuencia absoluta acumulada (faa))

A cada celda se le suma la frecuencia anterior (fi+fanteriores)

Faa

Novena  columna (frecuencia relativa (fr))

Fr

 

Decima  columna (frecuencia relativa acumulada (FRA))

FRA

 

 

Presentación de la tabla

Clases

Xi

Fi

Xifi

xi-µ

(xi-µ)2

fi(xi-µ)2

FAA

FR

FRA

Medidas de Tendencia Central

La obtención de los parámetros estadísticos para datos agrupados es distinto a los que no lo están para las medidas de tendencia central tenemos las siguientes formulas

MEDIA

    

 Donde:

µ= media

N= total de datos

Xi=marca de clase

Fi= frecuencia

Σ= sumatoria de la columna

MEDIANA

Para encontrar el intervalo medianal debemos sacar el 50% de los datos y localizar en que intervalo se encuentra según la frecuencia por ejemplo si son 40 datos hay que encontrar donde se encuentra el dato 20

Donde:

Me= mediana

Li= Limite inferior del intervalo

N=  Numero de datos

Fm-1= frecuencia acumulada antes del intervalo medianal

Fm= frecuencia del intervalo medianal

A= anchura del intervalo (LS-LI)

 

 

 

MODA

El intervalo modal es aquel que tiene la mayor frecuencia y se calcula con la siguiente fórmula:

Donde:

Mo= Moda

Li= Limite inferior del intervalo modal

Fm= frecuencia del intervalo modal

Fm-1= frecuencia del intervalo inmediato anterior al modal

Fm+1= frecuencia del intervalo inmediato superior al modal

A= anchura o amplitud del intervalo

MEDIDAS DE DISPERSION

La dispersión de la población la detectamos mediante tres medidas la varianza, la desviación estándar o típica y el coeficiente de variación.

Varianza

Donde:

σ2= varianza

Σ=sumatoria

Fi(xi-µ)2=columna

N= Total de datos

 

 

 

 

 

 

DESVIACION ESTÁNDAR

Donde:

σ= desviación estándar

Σ=sumatoria

Fi(xi-µ)2=columna

N= Total de datos

 

COEFICIENTE DE VARIACION

σ= desviación estándar

µ=media

 

 

 

 

 
Č
ĉ
ď
Ing. Juan Gerardo Mandujano Martinez,
29/8/2011 8:06
Comments