2.2 Variables aleatorias
Variable Aleatoria
Formalmente una variable aleatoria X esta definida en un espacio de probabilidad, y es medible. De forma práctica, una variable aleatoria es una descripción numérica de los resultados de un experimento aleatorio.
Ejemplo
Considera el experimento de lanzar una moneda dos veces, entonces podemos definir una variable aleatoria x como:
x= "Número de soles obtenidos al lanzar una moneda dos veces"
Otros ejemplos de variables aleatorias pueden ser:
x= "Número de productos defectuosos en una maquiladora"
x="Número de personas que llegan a un cajero automático"
Variables aleatorias discretas y continuas
Al igual que en estadística descriptiva a las variables aleatorias las podemos clasificar en variables aleatorias discretas y variables aleatorias continuas de acuerdo con los valores que pueden tomar.
Una variable aleatoria que asuma ya sea un número finito de valores o una sucesión infinita de valores tales como 0, 1, 2, . . ., se le llama variable aleatoria discreta. (El rango de X es numerable)
Si la variable puede tomar cualquier valor numérico dentro de un intervalo o colección de intervalos se le llama variable aleatoria continua. (El rango de X es no numerable)
Distribución de probabilidad de una variable aleatoria discreta
La distribución de probabilidad de una variable aleatoria x discreta, es una fórmula , tabla o gráfica, que da los posibles valores de x, y la probabilidad p(x) asociada con cada valor de x.
Ejemplo de distribución de probabilidad de una variable aleatoria discreta
Considera el ejemplo anterior, de lanzar una moneda dos veces,
Notamos que la variable aleatoria x solo toma los valores 0, 1 y 2. Para construir la distribución de probabilidad de x calculamos la probabilidad de cada valor de la variable aleatoria.
Distribución de probabilidad de la variable aleatoria x.
Histograma
La distribución de probabilidad de la tabla anterior se puede graficar para formar el histograma de probabilidad:
Función de probabilidad
En el caso de una variable aleatoria discreta, la función f(x) que asigna a cada valor de la variable aleatoria su probabilidad se conoce como función de densidad o función de probabilidad de la variable aleatoria x.
Condiciones requeridas para una función de probabilidad discreta
1.
2.
La media, varianza y desviación estándar de una variable aleatoria discreta
Sea x una variable aleatoria discreta con distribución de probabilidad p(x). La media o valor esperado de x está dado como
La varianza de x es
La desviación estándar
es igual a la raíz cuadrada postiva de la varianza.
Distribución binomial
Un experimento binomial es el que tiene estas cinco características:
El experimento consiste en n intentos idénticos.
Cada intento resulta en uno de dos resultados: éxito o fracaso.
La probabilidad de éxito en un solo intento es igual p y es igual de un intento a otro. La probabilidad de fracaso es igual a 1-p.
Los intentos son independientes.
Estamos interesados en x, el número de éxitos observados durante los n intentos, para x=0, 1, 2,...,n.
Ejemplo
Se sabe que un determinado antígeno da reacciones positivas en un 20% de la población. Considera el experimento de tomar 5 muestras de sangre y analizar si se produce una reacción. ¿Es este un experimento binomial?
Veamos si cumple con las 5 características binomiales:
1. Un intento es el análisis de una muestra de sangre. Este experimento consta de n=5 intentos idénticos.
2. Como en cada muestra se producirá o no una reacción, entonces hay dos resultados que representan los éxitos y fracasos.
3. Si consideramos que el hecho de que se produzca reacción en la muestra es un éxito, entonces la probabilidad de éxito es 0.20. Y se mantiene igual para cada muestra.
4. Como el hecho de que se produzca o no reacción en una muestra es independiente de lo que suceda para otra muestra, entonces los intentos son independientes.
5. La variable aleatoria x, es el número de muestras en las que se produce reacción, x=0,1,2,3,4,5.
Código en R
#Distribucion binomial.
x <- 0:17
y <- dbinom(x,size=12, prob=0.2)
plot(x,y)
#Funcion de distribucion acumulada
yp <- pbinom(x,size=12, prob=0.2)
plot(x,yp)
Ejemplo
En el ejemplo anterior, considera la pregunta ¿Cuál es la probabilidad de que se produzca reacción exactamente en 3 de las muestras?
Para responder la pregunta debemos calcular P(x=3), es decir, la probabilidad de tener k=3 éxitos y 2 fracasos en n=5 intentos.
Usando la distribución binomial de probabilidad:
Ejemplo
En el ejemplo anterior, considera la pregunta ¿Cuál es la probabilidad de que se produzca reacción exactamente en 3 de las muestras?
Para responder la pregunta debemos calcular P(x=3), es decir, la probabilidad de tener k=3 éxitos y 2 fracasos en n=5 intentos.
Usando la distribución binomial de probabilidad:
Cálculo usando R
Si en un experimento binomial queremos calcular la probabilidad de exactamente k éxitos en n intentos, donde la probabilidad de éxito es p, usamos
dbinom(k,n,p)
en el ejemplo anterior
dbinom(3,5,0.2)
Si queremos calcular la probabilidad de que se produzca reacción como máximo en dos de las muestras entonces nos interesa calcular
para calcular esta probabilidad usamos:
pbinom(2,5,0.2)
con lo cual obtenemos 0.94208.
Media:
Varianza:
Distribución de probabilidad de una variable aleatoria continua
Habíamos dicho que una variable aleatoria continua puede tomar cualquier valor en un intervalo, por lo tanto, ahora hablaremos de la probabilidad de que la variable aleatoria tome un valor dentro de un intervalo dado, es decir,
P(a<x<b).
Supongamos que tenemos un conjunto de mediciones de una variable aleatoria continua y creamos un histograma de frecuencia relativa para describir la distribución de las mismas. Cuando el número de mediciones se hace muy grande y los anchos de clase se hacen muy angostos, el histograma de frecuencia relativa aparece cada vez más como una curva suave, ver figura. Esta curva suave describe la distribución de probabilidad de la variable aleatoria continua.
Esta curva suave puede ser descrita por una formula matemática f(x) llamada función de densidad de probabilidad para la variable aleatoria x.
La función de densidad constituye una idealización de los histogramas de frecuencia o un modelo del cual suponemos que proceden las observaciones.
Características de la distribución de probabilidad continua
El área bajo una distribución continua de probabilidad es igual a 1.
P(a<x<b)=Área bajo la curva f(x) entre a y b.
Observación
Como un solo punto es un intervalo cuyo ancho es cero, esto implica que la probabilidad de que una variable aleatoria continua tome un valor exacto, cualquiera, es cero. Es decir,
P(x=a)=0