Formalmente una variable aleatoria X esta definida en un espacio de probabilidad, y es medible. De forma práctica, una variable aleatoria es una descripción numérica de los resultados de un experimento aleatorio.
Considera el experimento de lanzar una moneda dos veces, entonces podemos definir una variable aleatoria x como:
x= "Número de soles obtenidos al lanzar una moneda dos veces"
Otros ejemplos de variables aleatorias pueden ser:
x= "Número de productos defectuosos en una maquiladora"
x="Número de personas que llegan a un cajero automático"
Al igual que en estadística descriptiva a las variables aleatorias las podemos clasificar en variables aleatorias discretas y variables aleatorias continuas de acuerdo con los valores que pueden tomar.
Una variable aleatoria que asuma ya sea un número finito de valores o una sucesión infinita de valores tales como 0, 1, 2, . . ., se le llama variable aleatoria discreta. (El rango de X es numerable)
Si la variable puede tomar cualquier valor numérico dentro de un intervalo o colección de intervalos se le llama variable aleatoria continua. (El rango de X es no numerable)
La distribución de probabilidad de una variable aleatoria x discreta, es una fórmula , tabla o gráfica, que da los posibles valores de x, y la probabilidad p(x) asociada con cada valor de x.
Considera el ejemplo anterior, de lanzar una moneda dos veces,
Notamos que la variable aleatoria x solo toma los valores 0, 1 y 2. Para construir la distribución de probabilidad de x calculamos la probabilidad de cada valor de la variable aleatoria.
Distribución de probabilidad de la variable aleatoria x.
La distribución de probabilidad de la tabla anterior se puede graficar para formar el histograma de probabilidad:
En el caso de una variable aleatoria discreta, la función f(x) que asigna a cada valor de la variable aleatoria su probabilidad se conoce como función de densidad o función de probabilidad de la variable aleatoria x.
1.
2.
Sea x una variable aleatoria discreta con distribución de probabilidad p(x). La media o valor esperado de x está dado como
La varianza de x es
La desviación estándar
es igual a la raíz cuadrada postiva de la varianza.
Un experimento binomial es el que tiene estas cinco características:
El experimento consiste en n intentos idénticos.
Cada intento resulta en uno de dos resultados: éxito o fracaso.
La probabilidad de éxito en un solo intento es igual p y es igual de un intento a otro. La probabilidad de fracaso es igual a 1-p.
Los intentos son independientes.
Estamos interesados en x, el número de éxitos observados durante los n intentos, para x=0, 1, 2,...,n.
Se sabe que un determinado antígeno da reacciones positivas en un 20% de la población. Considera el experimento de tomar 5 muestras de sangre y analizar si se produce una reacción. ¿Es este un experimento binomial?
Veamos si cumple con las 5 características binomiales:
1. Un intento es el análisis de una muestra de sangre. Este experimento consta de n=5 intentos idénticos.
2. Como en cada muestra se producirá o no una reacción, entonces hay dos resultados que representan los éxitos y fracasos.
3. Si consideramos que el hecho de que se produzca reacción en la muestra es un éxito, entonces la probabilidad de éxito es 0.20. Y se mantiene igual para cada muestra.
4. Como el hecho de que se produzca o no reacción en una muestra es independiente de lo que suceda para otra muestra, entonces los intentos son independientes.
5. La variable aleatoria x, es el número de muestras en las que se produce reacción, x=0,1,2,3,4,5.
#Distribucion binomial.
x <- 0:17
y <- dbinom(x,size=12, prob=0.2)
plot(x,y)
#Funcion de distribucion acumulada
yp <- pbinom(x,size=12, prob=0.2)
plot(x,yp)
En el ejemplo anterior, considera la pregunta ¿Cuál es la probabilidad de que se produzca reacción exactamente en 3 de las muestras?
Para responder la pregunta debemos calcular P(x=3), es decir, la probabilidad de tener k=3 éxitos y 2 fracasos en n=5 intentos.
Usando la distribución binomial de probabilidad:
Si en un experimento binomial queremos calcular la probabilidad de exactamente k éxitos en n intentos, donde la probabilidad de éxito es p, usamos
dbinom(k,n,p)
en el ejemplo anterior
dbinom(3,5,0.2)
Si queremos calcular la probabilidad de que se produzca reacción como máximo en dos de las muestras entonces nos interesa calcular
para calcular esta probabilidad usamos:
pbinom(2,5,0.2)
con lo cual obtenemos 0.94208.
Media:
Varianza:
Habíamos dicho que una variable aleatoria continua puede tomar cualquier valor en un intervalo, por lo tanto, ahora hablaremos de la probabilidad de que la variable aleatoria tome un valor dentro de un intervalo dado, es decir,
P(a<x<b).
Supongamos que tenemos un conjunto de mediciones de una variable aleatoria continua y creamos un histograma de frecuencia relativa para describir la distribución de las mismas. Cuando el número de mediciones se hace muy grande y los anchos de clase se hacen muy angostos, el histograma de frecuencia relativa aparece cada vez más como una curva suave, ver figura. Esta curva suave describe la distribución de probabilidad de la variable aleatoria continua.
Esta curva suave puede ser descrita por una formula matemática f(x) llamada función de densidad de probabilidad para la variable aleatoria x.
La función de densidad constituye una idealización de los histogramas de frecuencia o un modelo del cual suponemos que proceden las observaciones.
El área bajo una distribución continua de probabilidad es igual a 1.
P(a<x<b)=Área bajo la curva f(x) entre a y b.
Como un solo punto es un intervalo cuyo ancho es cero, esto implica que la probabilidad de que una variable aleatoria continua tome un valor exacto, cualquiera, es cero. Es decir,
P(x=a)=0