Determinación del tamaño de muestra: un caso práctico

Linda Miriam Silerio Hernández

Tecnológico Nacional de México. Instituto Tecnológico de Durango

sihelinda@hotmail.com

Mayela del Rayo Lechuga Nevárez

Tecnológico Nacional de México. Instituto Tecnológico de Durango

mlechuga@itdurango.edu.mx

María del Pilar Reyes Sierra

Tecnológico Nacional de México. Instituto Tecnológico de Durango

mariapilareyes@itdurango.edu.mx

Resumen

El presente trabajo tiene como objetivo, dar respuesta a preguntas importantes que realiza el investigador, en el momento de llevar a cabo un proyecto de investigación, tal como ¿Cuál es el tamaño de muestra adecuado, que sea confiable y representativo de la población? ¿Cuántos instrumentos de medición son necesarios para aplicarlos a los sujetos de investigación? ¿Qué tipo de muestreo es el adecuado para cumplir los objetivos de la investigación? La determinación del tipo de muestreo y del tamaño adecuado de la muestra permiten la reducción de costos y tiempo. Una muestra que sea de un tamaño demasiado grande, tendrá como consecuencia la pérdida de recursos como tiempo y dinero, en tanto que una muestra muy pequeña puede no brindar la información suficiente. ¿Entonces de qué tamaño debe ser una muestra? la respuesta se da en función de qué tan cercanos se desea que los datos obtenidos del instrumento de medición estén con respecto a la población total. Uno de los puntos que se consideran en la determinación del tamaño de muestra es que ésta sea adecuada y representativa. La determinación del tamaño de muestra es solo el inicio, a partir de ella se obtienen datos importantes que permiten sacar conclusiones y tomar las mejores decisiones con respecto a los objetivos planteados en el proyecto de investigación. Se presentan dos métodos diferentes, el primero de ellos el cálculo del tamaño de muestra a partir de poblaciones infinitas y el segundo a partir de poblaciones finitas donde sí se conoce el tamaño de la población. Los resultados obtenidos a partir de los cálculos realizados en un caso práctico, permiten clarificar los tipos de muestreo existentes y las opciones para calcular el tamaño de la muestra, considerando primeramente la población como infinita y posteriormente como finita.

Palabras clave: tamaño de muestra, tipo de muestreo, fórmulas, caso práctico.

Abstract

The objective of this work is to answer important questions asked by the researcher, at the time of carrying out a research project, such as: What is the appropriate sample size that is reliable and representative of the population? How many measuring instruments are necessary to apply them to research subjects? What type of sampling is appropriate to meet the research objectives? The determination of the type of sampling and the appropriate sample size allow cost and time reduction. A sample that is too large in size will result in the loss of resources such as time and money, while a very small sample may not provide enough information. So what size should a sample be? The answer is given depending on how close you want the data obtained from the measuring instrument to be with respect to the total population. One of the points considered in the determination of the sample size is that it is adequate and representative. The determination of the sample size is only the beginning, from it important data is obtained that allow conclusions and make the best decisions regarding the objectives set in the research project. Two different methods are presented, the first of them calculating the sample size from infinite populations and the second from finite populations where the population size is known. The results obtained from the calculations made in a practical case, allow clarifying the types of existing sampling and the options to calculate the sample size, considering first the population as infinite and then as finite.

Keywords: sample size, type of sampling, formulas, case study.

Introducción

Para establecer las características del todo, se tiene que muestrear sólo una porción. En ciertos estudios de investigación, algunas veces es posible y práctico examinar a cada persona o elemento de la población que deseamos describir; a esto lo llamamos una enumeración completa o censo, sin embargo, se utiliza el muestreo cuando no es posible contar o medir todos los elementos de la población.

El propósito de la Estadística Inferencial consiste en determinar las características de la población a partir de las características de la muestra.

De acuerdo a Lind, Marchal & Wathen (2012), cuando se estudian las características de la población, existen diversas razones prácticas para seleccionar partes o muestras de ella para observar y medir:

a) Establecer contacto con toda la población requiere mucho tiempo.

b) El costo de estudiar todos los elementos de una población resulta prohibitivo.

c) Es imposible verificar de manera física todos los elementos de la población.

d) Algunas pruebas son de naturaleza destructiva, tal como los catadores de vino, si bebieran todo el vino para evaluar la vendimia, acabarían con la cosecha y no quedaría nada disponible para la venta.

e) Los resultados de la muestra son adecuados.

Desarrollo

Una muestra puede ser obtenida mediante dos tipos de técnicas: Muestreo Aleatorio y Muestreo No Aleatorio, las cuales a continuación se presentan:

Muestreo Aleatorio

En una muestra aleatoria se conocen las posibilidades de que un elemento de la población se incluya o no en la muestra, como consecuencia se puede determinar objetivamente las estimaciones de las características de la población que resultan de nuestra muestra, es decir; se puede describir matemáticamente qué tan objetivas son nuestras estimaciones. Dentro de este muestreo aleatorio se encuentran:

· Muestreo aleatorio simple.

· Muestreo sistemático.

· Muestreo estratificado.

· Muestreo por conglomerados

· Muestreo en dos etapas.

Muestreo aleatorio simple

“El muestreo aleatorio simple selecciona muestras mediante métodos que permiten que cada posible muestra tenga una igual probabilidad de ser seleccionada y que cada elemento de la población total una oportunidad igual de ser incluido en la muestra” (Levin & Rubín, 1994, p. 317).

Para ejemplificar el muestreo aleatorio simple y la selección, se supone una población de 100 empleados de una empresa textil, de la cual se va a elegir una muestra de 50. Una manera de seleccionar la muestra es escribir primero el nombre de cada obrero en un papel y depositarlos en una caja, mezclar todos los papeles, se selecciona uno de los papeles y se repite este proceso hasta completar la elección de los 50 obreros.

Un método más conveniente de seleccionar la muestra aleatoria es la utilización de un número de identificación para cada obrero y el apoyo de una tabla de números aleatorios.

Muestreo sistemático

En el muestreo sistemático, los elementos se seleccionan de la población con un intervalo uniforme que se mide en el tiempo, orden o espacio. Según el procedimiento sistemático, se obtiene muestra tomando cada unidad de la población tras enumerar las unidades de la población o haberlas ordenado de alguna manera. La letra representa un número entero, que es aproximadamente la razón de muestreo entre el tamaño de la población y el tamaño de la muestra. Así, si la población consiste en 1000 elementos de muestreo y se desea una muestra de 50 elementos, entonces

y la muestra se obtiene tomando una unidad cada veinte de la población, teniendo un punto de inicio aleatorio entre los primeros 20 elementos (Levin & Rubin, 1994). Con una razón de muestreo de 20, se puede utilizar el procedimiento de la bolsa poniendo 20 bolas numeradas del 1 al 20 en una bolsa, tras resolver y mezclar completamente, se saca una bola al azar, si se saca la bola 12, se empieza entonces con este número y se incluye en la muestra cada vigésima bola a partir de ésta, es decir, la treinta y dos, la cincuenta y dos, y así sucesivamente.

El muestreo sistemático se puede emplear fácilmente cuando se dispone ya de una lista de los elementos de la población. El procedimiento del muestreo aleatorio sistemático, selecciona una muestra más representativa que el muestreo aleatorio simple si los elementos cercanos de la población se asemejan más entre sí, de lo que se parecen a los que quedan distantes.

El muestreo sistemático tiene la desventaja de numerar u ordenar los elementos de una gran población dentro de un intervalo uniforme que se mide con respecto al tiempo, al orden o al espacio, lo cual podría resultar físicamente imposible si la población abarca todo un país o una zona geográfica considerable.

Muestreo estratificado

La población se divide en grupos o clases homogéneas denominados estratos. Después se utiliza uno de los dos planteamientos. O bien se selecciona aleatoriamente de cada estrato un número específico de elementos correspondientes a la fracción de ese estrato en la población como un todo o se extrae un número igual de elementos de cada estrato y se da un peso a los resultados de acuerdo con la porción del estrato con respecto a la población total. Con cualquiera de los dos planteamientos el muestreo estratificado garantiza que cada elemento de la población tenga posibilidad de ser seleccionado. El muestreo estratificado es más efectivo cuando se trata de poblaciones heterogéneas. Una ventaja del muestreo estratificado es que haciendo el diseño adecuadamente, puede reflejar de manera más precisa las características de la población de la cual fueron elegidas en comparación con otro tipo de muestreo. El muestreo estratificado se usa cuando cada grupo presenta una pequeña variación en su interior, pero gran variación entre cada estrato (Levin & Rubin, 1996).

Muestreo por conglomerados

La población se divide en grupos llamados conglomerados, los cuales entre sí son muy parecidos, pero internamente son heterogéneos, cada conglomerado representa a la población entera, es decir, se divide la población en varios grupos de características semejantes entre ellos y luego se analizan completamente algunos de los grupos, descartando los demás. Dentro de cada conglomerado existe una variación importante, es decir, internamente son heterogéneos, pero los distintos conglomerados son parecidos. Es necesaria una muestra más grande, pero suele simplificar la obtención de las muestras. Frecuentemente los conglomerados se aplican a zonas geográficas (Casal & Mateu, 2003). La población se divide en conglomerados a partir de los límites naturales geográficos o de otra clase (Lind, Marchal & Wathen, 2012). El muestreo por conglomerados se usa cuando hay alta variación dentro de cada conglomerado, pero entre uno y otro conglomerado hay mucha semejanza (Levin & Rubin, 1996).

Muestreo no aleatorio

En las muestras no probabilísticas, la manera de elegir los elementos no depende de la probabilidad, sino de causas relacionadas con las características de la investigación o de quien hace la muestra. El procedimiento no es mecánico ni con base en fórmulas de probabilidad, solo depende del proceso de toma de decisiones del investigador, las muestras que se seleccionan con base en otros criterios de investigación (Hernández, Fernández & Baptista, 2010), es decir, cuando el método de extracción de las muestras no asegura a cada elemento de la población o del estrato igual probabilidad de ser elegido, entonces la muestra obtenida es denominada como no aleatoria. Sobre este método de extracción se tiene:

Muestreo Intencional

En este tipo de muestreo se eligen casos característicos de una población, limitando la muestra sólo a estos casos. Se utiliza en contextos en los que la población es muy variable y consiguientemente la muestra es muy pequeña. Por ejemplo, entre todos los docentes de una institución de educación superior, se seleccionan a algunos de los docentes que posean perfil deseable para integrar el cuerpo académico y realizar las actividades correspondientes (Otzen & Manterola, 2017).

Accidental o consecutivo

Consiste en reclutar casos hasta que se completa el número de sujetos necesario para completar el tamaño de muestra deseado. Estos, se eligen de manera casual, de tal modo que quienes realizan el estudio eligen un lugar, a partir del cual reclutan los sujetos a estudio de la población que accidentalmente se encuentren a su disposición. Es similar al muestreo por conveniencia, excepto que intenta incluir a todos los sujetos accesibles como parte de la muestra (Otzen & Manterola, 2017). Por ejemplo, entre todos los docentes de una Institución de Educación Superior, se eligen los primeros 40 incluibles que lleguen a la sala de espera de la Subdirección Académica.

Muestreo deliberado

Es una técnica de muestreo no probabilístico, la muestra se determina por conveniencia, es por ello que también se le conoce como intencional o de conveniencia, puede ser que el investigador seleccione de manera directa e intencional los individuos de la población, tan solo por su fácil acceso, sin embargo, se debe tener cuidado en la interpretación de resultados obtenidos mediante este método de muestreo, dado que las muestras pueden no ser representativas de la población. Este tipo de muestreo permite seleccionar aquellos casos accesibles que acepten ser incluidos. Esto, fundamentado en la conveniente accesibilidad y proximidad de los sujetos para el investigador (Otzen & Manterola, 2017).

Muestreo por cuotas

El muestreo por cuotas, se utiliza en repetidos sondeos al mismo conjunto muestral, originalmente seleccionado de forma aleatoria. Se conocen las características de los estratos de la población y/o de los individuos más representativos de la población. Se caracteriza porque se fijan “cuotas” que son un número de sujetos de investigación que reúnen determinadas condiciones como por ejemplo que tengan una edad entre 20 y 30 años, que sean de género femenino y que residan en la ciudad de Durango, México, ya definidas las cuotas, se seleccionan los primeros que cumplan las características definidas. Este tipo de muestreo es útil en las encuestas de opinión, en donde cada segmento de la población cumple con las cuotas definidas para integrar la muestra, las cuotas pueden ser de diferente tamaño.

Fórmulas para el cálculo del tamaño de muestra

Existen varias fórmulas para calcular el tamaño de la muestra y su elección depende de la consideración de la población como infinita o finita. (Aguilar, 2005) definen que cuando el muestreo se hace en una población infinita el tamaño de la muestra puede ser calculado con la fórmula siguiente:

donde:

z=el valor de la distribución normal estandarizada correspondiente al nivel de confianza escogido.

p= es la proporción de la población que tiene la característica de interés (en la práctica, se hace una estimación de ).

q=1-p, es la proporción de fracaso.

d= Error máximo aceptable, es la mitad del intervalo de confianza deseado (que indica qué tan cerca se desea la estimación), también se le conoce como margen de error definido mediante la siguiente fórmula E= (límite de confianza superior – límite de confianza inferior)/2.

Por otra parte, Triola (2013) el valor de lo maneja como =Margen de error deseado, este autor refiere que cuando se utilizan los datos de una muestra aleatoria simple para llevar a cabo una estimación de la proporción poblacional el margen de error, denotado como es la diferencia máxima probable (con probabilidad , como 0.95) entre la proporción de la muestra observada y el valor de la proporción poblacional. El margen de error también se le conoce como error máximo de la estimación y se calcula multiplicando el valor crítico por la desviación estándar de las proporciones muestrales.

El margen de error indica la variación aceptable que se presenta en los resultados de la investigación, lo cual significa que los datos no son totalmente exactos o precisos, dado que se presenta un error de muestreo. Un menor margen de error requiere un tamaño de muestra más grande. A medida que aumenta el nivel de confianza, aumenta el tamaño de la muestra y viceversa.

Los niveles de confianza que típicamente son utilizados son el 90%, 95% y 99%. El nivel de confianza es la probabilidad 1-α, también se le conoce como grado de confianza o coeficiente de confianza, donde α (alfa) es la probabilidad de que el estadístico de prueba caiga en la región de rechazo o crítica cuando la hipótesis nula es verdadera. Sí el estadístico de prueba cae en la región crítica, se rechaza la hipótesis nula, de manera que α es la probabilidad de cometer el error de rechazar la hipótesis nula cuando es verdadera. Los valores más comunes que asume α son 10%, 5% y 1%.

Cuando no se dispone de una estimación de con base en estudios anteriores o similares y cuando es imposible o impráctico tomar una muestra piloto, se puede obtener el valor máximo de , mediante la fórmula mostrada a la izquierda, haciendo que , aunque el tamaño de la muestra obtenida en esta forma sea suficientemente grande, puede llegar a ser demasiado grande y entonces los costos del muestreo resultan mayores de lo que se necesita (Wayne, Vilamizar & Ardila, 1988).

Caso práctico y resultados

El presente caso hace referencia al estudio sobre Mentalidad Resilitente y Salud Mental Positiva en los docentes de nivel superior de la ciudad de Durango, Dgo., México, en una primera instancia sin conocer el tamaño de la población, se llevó a cabo el cálculo, mediante la siguiente fórmula, considerando un 95% de confianza, con un valor de d=0.05 y una proporción de éxito y fracaso del cincuenta por ciento, el resultado fue el siguiente:

Posteriormente, una vez definido el tamaño de la población conformada por 1975 docentes de nivel superior que laboran en instituciones públicas en la ciudad de Durango, Dgo., México, es decir, N=1975 , se procedió a utilizar la fórmula para poblaciones finitas (Aguilar, 2005).

Los datos que se sustituyeron en la fórmula para obtener el tamaño de la muestra final fueron: tamaño de la población N= 1975 , proporción de éxito p=0.50 la proporción de fracaso q=0.50 , un error máximo permisible de d=0.05 , el nivel de confianza se disminuyó 90% a para disminuir el tamaño de muestra sin que perdiera representatividad, con el cual se obtuvo un valor de z= 1.645 .

Los participantes que colaboraron como sujetos de investigación en el proceso son los docentes de nivel superior de instituciones públicas de la ciudad de Durango, Dgo., México. En la Tabla 1 aparece el número de docentes por institución y el total.

Como se mencionó anteriormente existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En esta investigación, se utilizó un muestreo aleatorio probabilístico estratificado.

Este tipo de muestreo exige conocer previamente a la población, el proceso de estratificación contempla el dividir la población en grupos o clases llamados estratos, cada estrato estuvo representado por el número de docentes de cada institución pública, se calculó el tamaño de muestra y aplicó el factor fh=n/N al número de docentes de cada estrato, para obtener el tamaño de las submuestras. El tamaño de muestra obtenido es de 238 el número de docentes por institución pública y el tamaño de las submuestras aparecen en la Tabla 2, las cuales se obtuvieron multiplicando el número de docentes por el factor fh que se obtiene dividiendo el tamaño de la muestra entre el tamaño de la población, el cual resultó ser 0.1205 .

En cuanto al análisis de resultados se puede observar que al disminuir el nivel de confianza de 95% a 90 % disminuyó el tamaño de muestra, si se hubiera deseado aumentar el tamaño de muestra hubiera sido necesario aumentar también el nivel de confianza; otra opción para disminuir el tamaño de muestra hubiera sido aumentar el valor de ; si se buscara aumentar el tamaño de muestra se pudiera disminuir el valor de . Es importante señalar que como investigador se tiene la facultad de elegir el nivel de confianza, entre los más utilizados se encuentran el 90%, 95% y 99%, mientras que el valor máximo del error permisible d, algunos investigadores en la práctica lo limitan a 0.07.

Existe software estadístico que facilita la realización de los cálculos antes mencionados como el Statdisk y el Minitab.

Bibliografía

Aguilar, S. (2005). Fórmulas para el cálculo de la muestra en investigación de salud. Salud en Tabasco. 11(1-2). Recuperado de https://www.redalyc.org/pdf/487/48711206.pdf

Casal, J. & Mateu, E. (2003). Tipos de muestreo. Epidem Med. Prev (1) 3-7. Recuperado de ttps://s3.amazonaws.com/academia.edu.documents/34046243/TiposMuestreo1.pdf

Hernández, R., Fernández, C. & Baptista, L. (2010). Metodología de la investigación. México: Mc Graw Hill.

Levin, R. & Rubin D. (1996). Estadística para administradores. México: Prentice-Hall.

Lind, D.A., Marchal, W.G. & Wathen, S.A. (2012). Estadística aplicada a los negocios y la economía. México: Mc Graw Hill.

Otzen, T. & Manterola C. (2017). Técnicas de muestreo sobre una población a estudio. Int. J. Morphol., 35(1):

Triola, M. (2013). Estadística. Actualización Tecnológica. México: Pearson Educación.

Wayne, D., Vilamizar, J. & Ardila, G. (1988) Estadística con aplicaciones a las ciencias sociales y a la educación. México: McGraw Hill.

PRAXIS EDUCATIVA ReDIE

Revista Electrónica de la Red Durango de Investigadores Educativos, A. C.

Año 11, Núm. 21; noviembre / abril 2020