diagrama.cajas.fnc

Copia, Pega y Adapta

diagrama.cajas.fnc(datos, vd=3)

diagrama.cajas.fnc(datos, vd=3, que.factor='zona')

diagrama.cajas.fnc(datos, vd='tr', identifica=T)

OBJETIVO

Permite valorar la distribución de una variable cuantitativa mediante el diagrama de cajas. La gráfica muestra un rectángulo que contiene en su interior al 50% centrado de la distribución con sus lados delimitados por el valor correspondiente al percentil 25 y 75 respectivamente. La mediana se representa mediante una línea gruesa de color negro. Los "bigotes" delimitan aproximandamente 1.5 la distancia intercuatílica (P75-P25). Asimismo toda observación que quede fuera de la superficie delimitada por estos marcadores (bigotes) serán marcados con un círculo.

Diagrama de cajas

Para demostrar la facilidad de uso de esta función, generaremos unos datos artificiales para 200 observaciones en la variable medida para dos grupos (A y B).

datos=data.frame(medida=c(rnorm(100,100,15),rnorm(100,90,22)),

grupo=factor(rep(c('A','B'),each=100)),

genero=factor(rep(c('H','M'),each=50)))


medida grupo genero

1 111.5089 A H

2 109.8613 A H

3 106.4138 A H

4 117.2250 A H

5 117.4536 A H

6 106.7223 A H


  1. diagrama.cajas.fnc(datos, vd='medida')

  2. diagrama.cajas.fnc(datos, vd='medida', que.factor='grupo')

  3. diagrama.cajas.fnc(datos, vd='medida', que.factor='grupo:genero')

Observa en la tercera llamada a la función que hemos incluido la "interacción" (grupo:genero) de los dos factores en el argumento que.factor. Esto provoca que se cree una sola gráfica con los diagramas de cajas correspondientes a las cuatro condiciones del cruce de ambos factores.

IDENTIFICAR CASOS EXTREMOS

Ahora provocaremos que los casos 50 y 80 presenten valores bajos y claramente distantes de la media del grupo A.

datos[50,1]=45

datos[80,1]=58

Veamos como "saber" el número del caso o registro al que pertenece un valor extremo en un diagrama de cajas. Lo conseguiremos incluyendo el argumento identifica=T.

diagrama.cajas.fnc(datos, vd='medida', que.factor='grupo',

identifica=T)

Cuando incluimos el argumento identifica=T, una vez creado el gráfico aparecerá una cruz que al situarla encima de los casos extremos y al hacer clic con el ratón revelará el número de registro al que pertenece. Dado que cada muestra se genera al azar, tus resultados gráficos no serán idénticos a los aquí presentados.