extrae.muestra.fnc

Copia, Pega y Adapta

muestra=extrae.muestra.fnc(datos, n=60, ID='sujeto')


muestra=extrae.muestra.fnc(datos, n=60, que.factor='grupo'

ID='sujeto')

OBJETIVO

Permite extraer muestras de tamaño n de una base de datos. El usuario puede solicitar que dicha muestra sea extraída a partir de los J niveles de un factor definido por el usuario.

MUESTRA ALEATORIA

Partiremos de la base de datos iris de la librería MASS la cual contiene 4 medidas realizadas en 150 plantas pertenecientes a 3 especies medidas con la variable Species.

Si en la base de datos a utilizar cada registro ocupa una sola fila (como es el caso de iris), no es obligatorio que exista una variable que controle el número de sujeto o registro. Sin embargo a modo de ejemplo vamos a crear una nueva variable en iris correspondiente al número de registro de cada una de las 150 plantas que llamaremos planta.

iris$planta=1:150

head(iris)

Queremos extraer una muestra de 75 plantas de las 150 que componen la base de datos iris. Queremos además que en dicha muestra el número de plantas por especies sea igual (25). A modo de ejemplo solicitaremos un n "imposible" con la intención de ver que nos informa la función en esa circunstancia.

muestra = extrae.muestra.fnc(iris, que.factor='Species', n=60, ID='planta')

El argumento opcional que.factor debe incluirse cuando deseas que la muestra extraída tenga el mismo número de observaciones por niveles del factor asignado a dicho argumento.

Nos indica que el tamaño de la muestra no puede ser superior a la frecuencia mínima del factor seleccionado (50 casos). Repetimos con el argumento n=25.

muestra = extrae.muestra.fnc(iris, que.factor='Species', n=25, ID='planta')

dimension(muestra)

El lector puede probar a extraer una muestra aleatoria de otra base de datos por ejemplo la ya conocida OBrienKaiser.

muestra.2= extrae.muestra.fnc(OBrienKaiser, n=10)

Te informa de que dado que no has introducido el argumento ID (identificación) se asume que cada sujeto ocupa solo una fila en la base de datos introducida. Si no fuera el caso (la unidad de registro no es la fila) la omisión de ese argumento haría que la muestra obtenida fuese incorrecta por incompleta.