Para saber cómo enfocar el estudio primero debemos tener en cuenta los diferentes alcances de las investigaciones cuantitativas:
Los estudios exploratorios examinan temas poco estudiados, sirven para familiarizarnos con fenómenos relativamente desconocidos. Ayudan a establecer las bases para realizar estudios más completos en el futuro.
Un ejemplo de estudio exploratorio sería examinar la realidad virtual para conocer algunas de las características pedagógicas que pueda tener.
Los estudios descriptivos sirven para especificar características concretas, ayudando a detallar cómo son y cómo se manifiestan. Su objetivo es únicamente medir y recoger información para explicar algo, sin relacionar unas características con otras.
Un ejemplo de estudio descriptivo puede ser describir la percepción de los estudiantes sobre el uso de las TIC. Otro ejemplo puede ser el estudio de diferentes variables para conocer a qué se debe el mal rendimiento de nuestros alumnos.
Los estudios correlacionales ayudan a conocer si existe relación entre características o variables diferentes. Se basan en comprobar una hipótesis de investigación a través de conocer la relación entre las variables de estudio.
Un ejemplo, relacionado con el anterior, en el que ya conozcamos variables que pueden influir en el mal rendimiento: como horas extraescolares, hermanos mayores, etc. sería correlacionar los resultados de estas variables con el rendimiento, para saber con qué variable se relaciona más el mal rendimiento.
Los estudios explicativos pretenden establecer la relación de causalidad, intentando predecir la influencia de una causa en un efecto producido. Se basan en comprobar una hipótesis de investigación, más concreta que las hipótesis de los estudios correlacionales, a través de conocer la relación entre las variables.
Un ejemplo de estudio explicativo puede ser conocer la relación que existe entre utilizar proyectos en clase y el desarrollo de la competencia social y cívica.
Si nuestra investigación está enfocada a conocer la relación entre variables, lo primero que debemos hacer es identificar las variables de estudio, es decir, las características que queremos medir o las características que debemos tener en cuenta a la hora de medirlo.
Las variables sirven para identificar posibles relaciones y cómo sería ésta en caso de que exista. Por tanto, las variables se utilizan en estudio en los que queramos comprobar relaciones: los estudios correlacionales, en los que simplemente medimos la relación, sin conocer cómo influye una variable en la otra; y los estudios explicativos, en los que comprobamos cómo influye una variable en otra.
Por una parte, tenemos la variable independiente y por otra la variable dependiente.
La variable independiente es la que permite diferenciar grupos de estudio, y se puede modificar por el investigador para comprobar cambios. Sería la causa.
La variable dependiente es la que se ve influida, es decir, que obtendrá resultados diferentes según el grupo de estudio o según la modificación de la variable independiente. Sería el efecto producido según la presencia o no de la causa.
Si nos fijamos en sus nombres, la variable dependiente DEPENDE de la variable que es independiente.
Por ejemplo, si queremos saber los resultados en aprendizaje en función del género, entendemos que el género me permite diferenciar dos grupos de estudio, por lo que el género es la variable independiente. Mientras que los resultados de aprendizaje DEPENDEN del género, por lo que los resultados será la variable dependiente.
Otro ejemplo sería si nosotros vamos a comprobar la eficacia de una intervención, por ejemplo, de un programa educativo de innovación que hemos creado. Podemos utilizar el programa con una clase y medir los resultados de aprendizaje en dos clases: en una que sí se ha intervenido, y en otra que no. En este caso, el investigador puede elegir si se aplica o no la variable independiente, es decir la intervención, y en función de esos dos grupos que se han creado (uno que sí aprende con la innovación y otro que aprende de manera tradicional) puede evaluar si hay diferencias en su variable dependiente, que sería los resultados de aprendizaje.
Si nuestra investigación está enfocada a conocer la relación entre variables, lo segundo que tenemos que hacer es decidir las hipótesis a partir de los objetivos. Cada uno de nuestros objetivos específicos corresponde a una pregunta de investigación de nuestro estudio. Y cada pregunta de investigación se puede traducir en una hipótesis que guiará el alcance de la investigación y los tipos de análisis que vamos a realizar con los datos.
Por ejemplo, si yo quiero medir el desarrollo de la creatividad al trabajar robótica, al leer la literatura relevante sobre el tema encuentro la propuesta de Torrance que define 4 dimensiones de creatividad: fluidez, flexibilidad, originalidad y elaboración. A partir de estas dimensiones, puedo establecer 4 objetivos específicos:
medir la fluidez tras trabajar con robótica
medir la flexibilidad tras trabajar con robótica
medir la originalidad tras trabajar con robótica
medir la elaboración tras trabajar con robótica
De estos 4 objetivos, podemos extraer nuestras 4 preguntas de investigación:
¿la fluidez mejora tras trabajar con robótica?
¿la flexibilidad mejora tras trabajar con robótica?
¿la originalidad mejora tras trabajar con robótica?
¿la elaboración mejora tras trabajar con robótica?
Estas preguntas de investigación permitirán definir nuestras hipótesis, hipótesis que orientarán nuestra investigación:
Hipótesis 1: los alumnos que trabajan con robótica mejoran en fluidez.
Hipótesis 2: los alumnos que trabajan con robótica mejoran en flexibilidad.
Hipótesis 3: los alumnos que trabajan con robótica mejoran en originalidad.
Hipótesis 4: los alumnos que trabajan con robótica mejoran en elaboración.
Para comprobar estas hipótesis, tenemos que traducirlas de forma cuantitativa, y esto dependerá de cómo enfoquemos el estudio.
Ejemplo alcance correlacional: una opción es que la robótica se mida a través del número de horas invertido, y correlacionar el número de horas con los resultados en cada dimensión de la creatividad para ir respondiendo a cada una de las hipótesis.
Ejemplo alcance explicativo: podríamos tener un grupo control que no trabaje con robótica, y poder explicar su relación comparando las medias de los dos grupos, es decir, del grupo que trabaja con robótica y del grupo control que no lo hace, para cada dimensión de creatividad.
El diseño se refiere al plan o estrategia concebida para obtener la información que se desea, partiendo de los objetivos de la investigación o de las hipótesis, para poder analizar si se cumplen las relaciones supuestas.
Un experimento se refiere a un estudio en el que se manipula intencionalmente una o más variables independientes, es decir, las supuestas causas antecedentes, para analizar las consecuencias que la manipulación tiene sobre una o más variables dependientes, es decir, los supuestos efectos consecuentes, dentro de una situación de control para el investigador.
Por tanto, para considerar un experimento se debe dar el control de la variable independiente para poder manipularla, es decir, si ocurre o no ocurre en cada grupo / nivel de la variable independiente.
Para comprobar que la variable independiente tiene efecto en la variable dependiente, debemos medir los resultados de la variable dependiente, pues es la que supuestamente se ve afectada por la variable independiente. Al tener varios grupos en función de los resultados de la variable independiente, cada grupo obtendrá unos valores concretos (como la media, la desviación típica, etc.), que podrán compararse con los valores concretos en la variable dependiente de los otros grupos creados por la variable independiente, y comprobar así si los grupos obtienen resultados diferentes, lo que significa que la variable independiente sí afecta a la variable dependiente.
Vamos a verlo mejor con un ejemplo: si quiero comprobar si una propuesta educativa que he creado mejora el aprendizaje de los alumnos, la propuesta educativa será la variable independiente y el aprendizaje será la variable dependiente. Si a la clase de 1ºA le aplico la propuesta y a la clase de 1ºB no le aplico la propuesta, en principio, según mi intención, será que la clase de 1ºA obtenga resultados mayores en el aprendizaje que la clase de 1ºB.
Se trata de un experimento porque decido a qué grupo se le aplica la intervención, es decir, la propuesta educativa, y a qué grupo no se le aplica la intervención. De esta forma, puedo saber si hay diferencias en el aprendizaje, es decir, en la variable dependiente, la que depende de la intervención.
En la investigación cuantitativa, los diseños pueden ser experimentales o no experimentales, ya que no siempre podremos controlar la variable independiente.
En cuanto a DISEÑOS EXPERIMENTALES, distinguimos internamente tres tipos de diseño:
En el diseño preexperimental el grado de control es mínimo, pero queremos probar la relación de una causa en un efecto, es decir, de una variable independiente sobre una variable dependiente. Sin embargo, no cumple los requisitos de los experimentos, como que se manipule la variable independiente y que de ahí surjan diferentes grupos para comparar resultados.
Un ejemplo de un diseño preexperimental sería que queramos comprobar si el asistir a clases particulares sobre matemáticas mejoran los resultados de un grupo de alumnos.
En el diseño cuasiexperimental no se pueden hacer los mínimos controles sobre la asignación de los sujetos a los grupos de estudio, con lo que no podemos asegurar que los grupos sean equivalentes, como puede ser tener unos grupos de clase predefinidos.
Un ejemplo de diseño cuasi-experimental sería que creamos una propuesta educativa innovadora para aplicarla en la clase de 1ºA y comparamos los resultados con la clase de 1ºB para comprobar si han aprendido más. Quizá, de manera general, el grupo de 1ºA habitualmente obtenga mejores notas que el grupo de 1ºB, por lo que no podríamos asegurar que si se obtienen mejores notas después de la innovación se deba a la innovación y no a que el grupo parte de inicio con esa ventaja.
En el diseño experimental puro controlamos todo el estudio: la aplicación de variables, la asignación de sujetos a los diferentes grupos, etc.
Un ejemplo de diseño experimental puro sería que en una misma clase se hacen 2 grupos aleatorios para probar 2 herramientas: cada grupo la prueba en un orden, y se comprueba si el orden de uso de las herramientas afecta en la comprensión del contenido.
En el DISEÑO NO EXPERIMENTAL, o también llamado “ex post facto”, los niveles de la variable independiente no son controlados porque están fuera de nuestro control. Por ejemplo, la edad o el género. También puede ocurrir que los hechos y las variables ya ocurrieron, por lo que nos limitamos a observar la situación actual. Por ejemplo, una intervención que ya ocurrió, y que nosotros no podemos aplicar ni decidir sobre su aplicación.
Un ejemplo de diseño no experimental, en el que no podemos controlar los niveles de la variable independiente, sería si queremos saber si los ejes de coordenadas se entienden bien en diferentes edades, así que explicamos los ejes de coordenadas en 5º primaria y en 2º ESO con un experimento y comprobamos si lo entienden igual o hay diferencias por edad.
Un ejemplo de diseño no experimental, en el que no podemos decidir la aplicación de la variable independiente porque ya ocurrió, sería comprobar si los alumnos que han asistido a clases extraescolares durante el curso han obtenido mejores notas.
Los diseños no experimentales se diferencian por el número de veces que recopilan la información.
Si sólo se recoge información una vez, hablamos de un diseño transversal.
Si, por el contrario, se recoge información de los mismos sujetos varias veces en diferentes momentos, hablamos de un diseño longitudinal, diseño que ayuda a conocer la evolución del problema de investigación.
Llegados a este punto debemos conocer qué tipos de diseños experimentales podemos utilizar en función del alcance de nuestra investigación.
Podemos utilizar diseños preexperimentales en el caso de que nuestro objetivo sea exploratorio o descriptivo, ya que son diseños con muy poco control y no nos sirve para confirmar relaciones, sino que nos sirve únicamente para explorar y describir situaciones.
Podemos utilizar diseños cuasiexperimentales en el caso de que nuestro objetivo sea correlacional o explicativo, ya que, aunque los sujetos no los podamos asignar aleatoriamente a los grupos, el resto de controles sí que se cumplen, por lo que se pueden considerar diseños aptos para validar relaciones, ya sea al nivel de confirmar si existe o no tal relación, como es el caso de los estudios correlacionales, o al nivel de comprobar cómo sucede dicha relación, como es el caso de los estudios explicativos.
Podemos utilizar diseños experimentales puros en el caso de que nuestro objetivo sea explicativo. El utilizar un diseño tan estructurado y con tantos controles, no será eficiente si nuestro único objetivo es explorar, describir o correlacionar variables. Este grado de control sólo se lleva a cabo si nuestro objetivo es explicar la relación existente entre las variables.
En el caso de los diseño no experimentales, también se eligen en función del alcance de nuestra investigación.
Podemos utilizar diseños transversales en cualquier caso. En el caso de los diseños exploratorios y descriptivos, este diseño será ideal porque resulta suficiente para poder explorar y describir situaciones. En el caso de los diseños correlacionales y explicativos, cuyos diseños deben tener un mayor grado de fiabilidad, el diseño transversal será útil si existen bases para inferir la causalidad, un mínimo de control y se proporcionan los análisis estadísticos apropiados para comprobar las relaciones causales.
Podemos utilizar diseños longitudinales en el caso de que nuestro objetivo sea correlacional o explicativo. La repetición de medidas, es decir, el recoger datos en diferentes momentos, es adecuado para estudiarlos de forma conjunta de cara a comprobar cómo es la relación entre dos variables, a partir de su evolución. No tiene sentido utilizarlo para objetivos menos ambiciosos, como explorar y describir, porque implica mucho trabajo para lo que queremos conseguir.
Los diseños experimentales tienen una serie de características propias que les permiten ser considerados como tal, como la necesidad de manipular la variable independiente y registrar los resultados de la variable dependiente para compararlos en grupos formados en función de los valores de la variable independiente. Además, en los diseños experimentales destaca la necesidad de validez interna, es decir, de tener un control suficiente que asegure la fiabilidad de los resultados obtenidos.
Por una parte, se recomienda el uso de un grupo control como parte del estudio. El grupo control es un grupo equivalente al nuestro en cuanto a características y número de participantes, al que no se le aplica la intervención, pero igualmente se miden sus resultados. Si queremos comprobar que la relación entre la variable independiente y la variable dependiente es real y significativa, la inclusión de un grupo control va a permitir que podamos comparar los resultados de nuestro grupo de estudio con los del grupo control.
Al plantear las hipótesis con el grupo control, nuestra hipótesis nula se planteará como que los dos grupos obtienen resultados iguales. La hipótesis nula siempre se plantea como igualdad de medias, y nuestro objetivo suele corresponder con rechazar la hipótesis nula, lo que quiere decir que sí que hay diferencias entre los grupos. Para ello, se plantea una hipótesis alternativa en la que especificamos si nuestra intención es que el grupo experimental obtenga una puntuación diferente al grupo control, o en concreto, si obtiene una puntuación menor cuando queremos que disminuya una conducta, o si obtiene una puntuación mayor cuando queremos que desarrollen alguna habilidad u obtengan un mayor conocimiento.
Por otra parte, cuando las variables dependientes deban desarrollarse en función de una variable independiente, conviene aplicar los instrumentos de recogida de datos antes y después de la intervención. De esta forma, podremos comprobar si realmente se ha desarrollado, o las puntuaciones en la variable dependiente eran altas desde el principio. A esto se le conoce como estudio pre-post: pre de la medida previa a la intervención y post de la medida posterior a la intervención.
Interpretando las hipótesis que debemos plantear, en la primera medición, la que corresponde al “pre”, lo ideal es que los grupos no muestren medias diferentes, es decir que sean grupo equivalentes, para lo que querremos que se acepte la hipótesis nula de igualdad de medias.
En el caso de la segunda medición, la medición “post”, querremos que los grupos sí que muestren medias diferentes, pues de esta forma podremos confirmar que estas diferencias se deben a la intervención. Por tanto, en la medición posterior queremos que se rechace la hipótesis nula y que se acepte la hipótesis alternativa.
La hipótesis que plantearíamos en este caso sería que las medias de las mediciones 1 y 2 del grupo experimental van a ser diferentes, debido a la intervención. Mientras que en el grupo control, las medias de las mediciones 1 y 2 deberán ser iguales, puesto que no han recibido la intervención.
Por ejemplo, si hacemos una propuesta de innovación educativa con robótica y queremos comprobar si desarrolla el pensamiento lógico, no conseguiremos saberlo de forma fiable si no medimos el nivel de pensamiento lógico que los alumnos tenían antes de trabajar con nuestra propuesta de robótica.
Lo más importante para la selección de la muestra en estudios cuantitativos, es el diferenciar entre muestras probabilísticas y muestras no probabilísticas, para saber elegir el adecuado y poder seleccionar a los sujetos de forma correcta.
Por una parte, en las muestras probabilísticas, es importante tener en cuenta el tamaño muestral que permite extraer conclusiones sobre toda la población. El tamaño muestral se calcula a partir del tamaño de la población, del nivel de confianza elegido y del margen de error establecido, algo que veremos en los resultados. Existen calculadoras en internet que calculan el tamaño muestral adecuado en función de estos 3 datos.
Una vez que conozcamos el tamaño muestral, es decir, el número de participantes que debemos tener en nuestra investigación, la selección de esos participantes debe realizarse de manera aleatoria. En los experimentos puros es muy importante tener en cuenta esta característica, ya que nos asegurará que nuestros grupos sean equivalentes. Esta forma de muestreo se conoce como M.A.S., que significa Muestreo aleatorio simple. Si no tenemos una muestra aleatoria, estaríamos hablando de un cuasiexperimento.
Además, la selección aleatoria de participantes nos permite asegurar la representatividad de la población. Esto quiere decir que todas las características de nuestra población estarían representadas en algunos de los sujetos de nuestra muestra.
Por otra parte, en las muestras no probabilísticas, también llamadas muestras dirigidas, el muestreo se realiza a elección del investigador, que busca seleccionar sujetos que muestren las características de la investigación.
Esta particularidad no permite asegurar la generalización que sucede con las muestras probabilísticas, pero permite que la muestra final esté más controlada según las características que queramos, por lo que permite responder al problema según los intereses de la investigación. Por tanto, es importante tener en cuenta que la menor fiabilidad para la generalización de resultados, provoca que estos resultados no puedan aplicarse siempre a toda la población de referencia.
La elección de un tipo de muestra en las investigaciones cuantitativas dependerá, como siempre, de nuestros objetivos, pero también de las posibilidades de aplicación del diseño de la investigación.
Como en la investigación cualitativa, la selección de sujetos para la muestra dirigida (no probabilística) dependerá del tipo de sujetos que respondan mejor a nuestros objetivos de investigación.
Participantes voluntarios: la muestra elige voluntariamente participar en la investigación.
Expertos: si necesitamos expertos en un tema para precisar teorías o diseño de cuestionarios.
Casos tipo: sujetos concretos para conseguir la máxima riqueza, profundidad y calidad en la información.
Por cuotas: buscando la representación equivalente de diferentes grupos de estudio.
Orientadas a la investigación:
máxima variación: sujetos diferentes para mostrar distintas perspectivas o representar la complejidad de un tema
homogéneas: sujetos con perfil similar para centrarse en cosas comunes
en cadena o por redes: se amplía la muestra a través de informantes clave que conozcan otras personas relevantes
casos extremos: para evaluar características o situaciones alejadas de la normalidad
por oportunidad: sujetos que se reúnen con motivo ajeno a la investigación
conceptuales: sujetos que contienen características clave para explicar una teoría
confirmativas: se añaden sujetos según si existen resultados controvertidos
críticas: cuando se utilizan todos los sujetos importantes
por conveniencia: sujetos disponibles a los que tenemos acceso
Hay que tener en cuenta que, en las investigaciones educativas, la mayoría de las ocasiones nos encontramos con los grupos de clase predefinidos. Por tanto, en estos casos, utilizaremos una muestra no probabilística obtenida por conveniencia.
Los instrumentos deben representar las variables de investigación. Esto quiere decir que resulta fundamental saber con qué variable está relacionada cada parte del instrumento. De esta forma, cuando vayamos a analizar los resultados, podremos analizar cada parte del instrumento de forma independiente, para responder a cada objetivo de la investigación.
Por ello, debemos plantear en la investigación, antes de recoger los datos, la correspondencia total que existe entre cada pregunta o parte del instrumento de evaluación y los objetivos que responde.
Para facilitar este análisis, las respuestas que se recogen en los instrumentos deben estar codificadas, en diferentes rangos o niveles. Por ejemplo, si estamos evaluando la resolución de problemas a través de una pregunta concreta, podremos establecer tres niveles:
puntuación 0 si no resuelve el problema
puntuación 1 si resuelve el problema
puntuación 2 si resuelve el problema de forma óptima
Esta codificación nos ayudará a distinguir con mayor conocimiento de causa entre los diferentes sujetos, lo que facilitará posteriormente interpretar los resultados en función de los niveles de respuesta. Siguiendo con el ejemplo, no es lo mismo para nuestra investigación una persona que resuelve un problema, que una persona que lo resuelve de la forma más eficaz.
La codificación depende del tipo de datos que queramos analizar. Como veremos en el paso 4 sobre resultados, en la investigación cuantitativa existen datos cualitativos nominales y ordinales, y datos cuantitativos discretos y continuos.
Los datos nominales se codifican con etiquetas numéricas para facilitar el análisis. Por ejemplo, hombre y mujer podrían codificarse como 0 y 1. Otro ejemplo sería apuntar la religión de los participantes, siendo 0 católicos, 1 musulmanes, 2 judíos, 3 ateos, etc.
Los datos ordinales son datos no cuantitativos, pero que siguen un orden. Por ejemplo, si queremos saber el grado de acuerdo de los participantes respecto a una afirmación como “me siento bien cuando ayudo a otras personas”, podemos codificarlo de manera ordinal, en una escala del 1 al 5, donde 1 sea no estoy nada de acuerdo y 5 sea estoy totalmente de acuerdo.
Los datos cuantitativos podríamos decir que ya están codificados, aunque nos vendrá bien organizarlos en cuanto a intervalos cuando existan muchos datos y estos estén dispersos. Por ejemplo, las horas de internet serían cuantitativos discretos si preguntamos por una estimación de horas exactas, o el peso será cuantitativo continuo. En estos casos podemos crear intervalos. Por ejemplo, menos de 1 hora de internet, entre 1 hora y 3 horas, o más de 3 horas.
Por otra parte, un instrumento adecuado debe contar con unas medidas psicométricas que aseguren que el instrumento es adecuado para medir nuestras variables de estudio. La psicometría se encarga de estudiar las propiedades con las que debe contar un instrumento de medición, utilizando la estadística como pilar básico para elaborar teorías y desarrollar métodos y técnicas específicas de medición.
La primera medida psicométrica es la FIABILIDAD, o confiabilidad, que consiste en medir el grado con el que el instrumento produce resultados consistentes y coherentes. Existen diferentes formas de medir la fiabilidad, según a qué nos refiramos con fiabilidad.
En la estabilidad temporal, la fiabilidad se obtiene de hallar la correlación entre las puntuaciones en un test, y las puntuaciones en el mismo test en una aplicación temporal diferente. Si la distribución de las respuestas es similar, se obtendrá una correlación alta, y se concluirá que el test es fiable en cuanto a estabilidad temporal.
La distribución de las respuestas se refiere a que, si una persona obtiene alta puntuación en unas preguntas y baja puntuación en otras preguntas, aunque en la siguiente aplicación del test, supongamos 3 meses después, no obtenga exactamente las mismas puntuaciones, la distribución será similar: las mismas preguntas con puntuación alta, seguirán siendo las que tienen mayor puntuación respecto a las preguntas con puntuación baja.
La consistencia interna sirve para confirmar que todas las preguntas del instrumento miden lo mismo. Se puede realizar de dos formas.
El método de dos mitades, en el que se divide el instrumento en dos partes, habitualmente una parte contiene las preguntas pares, y la otra parte contiene las preguntas impares, obteniendo así dos instrumentos supuestamente equivalentes. Se halla la puntuación de ambas mitades y se obtiene la correlación entre ellas. Si la correlación es alta, significa que ambas mitades miden la misma variable, asegurando una alta consistencia interna.
El coeficiente alfa de Cronbach se utiliza si todos los ítems son paralelos, es decir, si todos miden una única dimensión o rasgo. Sus valores suelen estar entre 0 y 1, nunca mayores a 1. El mínimo de fiabilidad válido para asumir que un instrumento es consistente es 0,7. Y se empieza a considerar aceptable a partir de 0,8.
Las formas paralelas mide la fiabilidad de un segundo instrumento, hallando la correlación con las puntuaciones del primer instrumento. Si la correlación es elevada, se puede afirmar que el segundo test mide lo mismo que el primero, es decir, que ambos son equivalentes.
La segunda medida es la VALIDEZ, que consiste en medir el grado en que un instrumento mide realmente la variable que pretende medir. Igualmente, existen diferentes tipos de validez en función del tipo de evidencia que necesitemos comprobar, es decir, del tipo de conclusiones o inferencias que queramos extraer a partir de las puntuaciones obtenidas en el instrumento.
La validez de contenido se refiere al grado en que un instrumento mide el contenido por completo, es decir, si incluye elementos representativos de todos los aspectos o dimensiones a medir. Un ejemplo clásico en la validez de contenido sería si un examen pregunta por todos los temas o sólo por algunos, ya que, si no pregunta por todos los temas, no tendrá suficiente validez de contenido.
La validez de criterio pretende confirmar si el instrumento es válido a través de la comparación de las puntuaciones con un criterio externo, por ejemplo otro instrumento para medir lo mismo que ya esté validado. Por ejemplo, si estamos creando un test que queremos utilizar para medir la creatividad, podemos aplicar nuestro test y otro test ya validado de otros autores, y hallar si la correlación entre ambos es alta para confirmar que nuestro test realmente mide creatividad.
La validez de constructo es la más importante de todas, ya que relaciona el instrumento con la teoría, es decir, correlaciona el instrumento con el constructo definido en la teoría. Este tipo de validez incluye representar las diferentes dimensiones que se propongan en la teoría. Por ejemplo, siguiendo con el ejemplo de creatividad, si en la teoría se consideran cuatro dimensiones como son fluidez, flexibilidad, originalidad y elaboración, en la validez de constructo se confirmará si existen los factores, dando información sobre qué preguntas correlacionan entre sí. A esto se le conoce como análisis factorial, ya que confirma los factores o dimensiones del constructo.
Por último, un instrumento debe contar con OBJETIVIDAD, es decir, debe ser objetivo. La objetividad se mide en función del grado en el que el instrumento es permeable a los sesgos y tendencias del investigador que lo utiliza.
La observación en la investigación cuantitativa difiere de la observación para investigación cualitativa, ya que en el enfoque cuantitativo debe ser mucho más estructurada, es decir, debemos realizar un registro sistemático de las categorías y subcategorías que queramos estudiar.
Una técnica muy habitual es la de utilizar códigos arbitrarios a través de una hoja o lista de cotejo que recoja las distintas categorías. Para ello, debemos crear una tabla que todas esas categorías y dividir cada categoría en diferentes fragmentos de observación, que den lugar a diferentes registros.
Para registrar adecuadamente las categorías, establecemos un tiempo para la observación y un tiempo para el registro. Por ejemplo, 25 segundos para cada observación y 5 segundos para cada registro. Si suponemos un total de 3 minutos de observación, necesitamos dividir la tabla en 6 registros.
Nuestro interés puede recaer en registrar la presencia o no de una conducta, para lo que establecemos las respuestas: sí, no o no procede; o puede recaer en registrar la frecuencia de una conducta, anotando el número de veces que esa conducta sucede en cada franja de tiempo de observación.
Las escalas de medición de actitudes nos permiten averiguar la predisposición de los participantes ante determinadas cuestiones, su percepción sobre un tema o su opinión. Por ello, hay que tener en cuenta que no son instrumento objetivos para medir un tema, sino que son subjetivos sobre la percepción del participante. Por ejemplo, no medirán el conocimiento, sino el grado que cree el participante que tiene respecto al conocimiento sobre el tema.
Las escalas más utilizadas son las escalas tipo Likert. En las escalas tipo Likert, podemos encontrar preguntas sobre:
el grado de acuerdo sobre un tema. En este caso las respuestas serán una escala entre “totalmente en desacuerdo” y “totalmente de acuerdo”.
el grado de acuerdo sobre una creencia. En este caso las respuestas serán una escala entre “completamente falso” y “completamente verdadero”.
el grado de ocurrencia o frecuencia de una conducta. En este caso, las respuestas serán una escala entre “nunca” y “siempre”, teniendo respuestas intermedias del tipo “bastante” “algunas veces” y “pocas veces o casi nunca”.
En muchas de las ocasiones se utilizan escalas tipo Likert con 5 opciones de respuesta, aunque se pueden encontrar escalas con 3 o 7 opciones de respuesta. También se puede dar el caso en el que el investigador no quiera que los participantes se sitúen en la puntuación central, la más neutral, porque no aporta apenas información, por lo que optan por escalas con opciones de respuesta pares.
Las escalas están compuestas por ítems que pueden medir diferentes aspectos. Los ítems se deben formular de manera afirmativa. Por ejemplo “me gusta jugar a videojuegos”, “creo que es importante ser tolerante con los compañeros”, o “siempre hago esquemas y resúmenes cuando estudio un tema”.
En las escalas se pueden incluir afirmaciones negativas, que, en complementación a afirmaciones similares con enfoque positivo, servirán para comprobar el grado de sinceridad de las respuestas. Por ejemplo, si incluimos una afirmación con enfoque positivo sobre la estrategias de aprendizaje que sea “siempre hago esquemas y resúmenes cuando estudio un tema”, podremos añadir un ítem complementario con enfoque negativo que sea “no utilizo esquemas y resúmenes para estudiar”.
En estos casos, a la hora de interpretar los resultados, tenemos que tener en cuenta que se interpretan de forma inversa: la respuesta 1 será contabilizada como un 5, y la respuesta 5 será contabilizada como un 1.
Un cuestionario es un conjunto de preguntas que permiten responder a las variables de estudio. Las preguntas deben abarcar todas las variables de estudio, y se recomienda incluir varias preguntas por cada variable para poder contrastar la información e, incluso, complementarla.
Las preguntas pueden ser:
cerradas, si contienen categorías u opciones de respuesta. En este caso, podemos tener preguntas cerradas que requieran una sola opción de respuesta, como por ejemplo, marcar si el participante es estudiante o no; y preguntas cerradas en las que se puedan marcar varias opciones de respuesta, como por ejemplo, opciones de ocio los fines de semana, donde se proporciona una lista que incluye: cine, videojuegos, escuchar música, etc. También pueden darse preguntas cerradas en las que se deba incluir alguna información concreta en cada respuesta, como por ejemplo, asignar una puntuación a cada opción de ocio según el gusto.
de escala, siendo un tipo de pregunta cerrada que permite diferenciar grados o niveles respecto a una variable. Son preguntas de carácter ordinal, como las que emplean una escala de respuesta tipo Likert. Por ejemplo, responda del 1 al 5 su grado de acuerdo con las siguientes afirmaciones.
abiertas, en las que se ofrece un espacio para que el participante anote aquello que crea oportuno. A la hora de analizar las respuestas abiertas, las categorías de respuesta pueden ser casi infinitas, ya que cada participante puede haber anotado algo totalmente diferente al resto.
combinación de pregunta abierta con cerrada. Existen ocasiones en las que podemos partir de una pregunta abierta más general, y a partir de la respuesta, proponer una pregunta relacionada de opción cerrada para confirmar su respuesta. Así obtendremos información complementaria. Para optar por esta opción, hay que tener muy claro cómo se quiere interpretar la combinación de ambas respuestas. Si no, no merece la pena incluirlas.
Un cuestionario se divide en varias partes, en función del objetivo de cada una de las preguntas:
Introducción al estudio y consentimiento.
Preguntas de identificación, como por ejemplo, el nombre, el DNI, el género, la edad,...
Preguntas de control, como por ejemplo el gusto por una asignatura para dividir algunos con mayor o menor motivación en la asignatura, para comparar posteriormente si existen diferencias en otra variable como aprendizaje en función de los grupos: motivación alta y motivación baja.
Preguntas propias de la investigación, relacionadas con medir la variable dependiente. Siguiendo con el ejemplo, serían las preguntas destinadas a conocer el conocimiento en la asignatura para conocer el aprendizaje.
Estas preguntas cuentan con una serie de requisitos y recomendaciones:
Se deben identificar con categorías. Se pueden ordenar por las diferentes categorías, o se pueden ordenar de forma aleatoria, siempre que tengamos claro a qué categoría corresponde.
Según nuestro objetivo, se pueden incluir preguntas de escala tipo Likert, como las que se incluyen en las escalas de medición de actitudes.
Dados los avances en tecnología a nivel de usuario, se recomienda utilizar una herramienta para crear formularios, como Google Forms o Survey Monkey. Estas herramientas nos facilitan los resultados en formatos que podemos abrir desde los instrumentos de análisis, como Excel o SPSS, y también suelen proporcionar gráficas que permiten la interpretación de resultados.
Las pruebas estandarizadas son más conocidas como test o inventarios.
Estas pruebas se especializan para medir una variable específica, y existen pruebas para medir miles de variables. Por ejemplo, el cociente intelectual se realiza a través de varias de estas pruebas, con diferentes enfoques en función de la base teórica en la que se basan, aunque algunas teorías sobre inteligencia son más aceptadas que otras. También existen test para medir la orientación vocacional, prueba que se utiliza habitualmente en el último curso de educación secundaria. Otros test pueden ser: sobre motivación, sobre estrategias de aprendizaje, sobre creatividad, y un largo etcétera.
Se conocen como pruebas estandarizadas porque han pasado por suficientes pruebas psicométricas para considerar que son pruebas “estándar”, es decir, para todos. Las pruebas psicométricas recordemos que son pruebas que miden la fiabilidad y la validez del instrumento con cientos e incluso miles de sujetos, para poder demostrar que realmente dicha prueba mide lo que pretende.
Los resultados de estas pruebas psicométricas se recogen en artículos científicos, del tipo “validación del inventario” o similar. En estos artículos se recogen los ítems de las pruebas y cómo se interpretan sus resultados.
En otros casos, toda la fundamentación teórica y la validación de las pruebas se recogen en libros que son comercializados por algunas editoriales. Por ejemplo, una de las editoriales de pruebas estandarizadas más conocidas en España es TEA Ediciones.
Algunas de estas pruebas están siendo digitalizadas, con lo que los resultados se ofrecen de manera interpretada automáticamente al finalizar la aplicación de la prueba.
Algunas mediciones se pueden realizar a través de diferentes aparatos y equipos, que resultan ser sistemas de medición más objetivos que otros instrumentos que miden la percepción u opinión de los participantes sobre un tema.
Cada vez encontramos más aparatos dada la rápida evolución de la robótica, que permite la inclusión de sensores que nos permiten registrar respuestas. Por ejemplo, antes se utilizaba bastante el polígrafo o “detector de mentiras” midiendo la respuesta galvánica de la piel. También se puede registrar con una cámara el movimiento ocular, de forma que sepamos hacia qué elementos está mirando el participante, por ejemplo, dentro de una fotografía.
La neurociencia es una disciplina en la que todos los registros se realizan a través de máquinas, instrumentos que captan la actividad cerebral, como la resonancia magnética funcional (RMf) para el estudio de las funciones cerebrales que logra identificar y localizar fenómenos específicos del metabolismo y la actividad neuronal, o la electroencefalografía (EEG) que registra de la actividad bioeléctrica cerebral en condiciones basales de reposo, en vigilia o sueño.
Existen otros tipos de instrumentos para la recogida de datos cuantitativos. Por ejemplo:
El análisis de contenido cuantitativo, que permite objetivizar y sistematizar cualquier tipo de comunicación, cuantificando los mensajes en categorías y subcategorías.
Los datos secundarios se refiere a datos recogidos por otros investigadores, que pueden encontrarse en registros públicos. Por ejemplo, archivos de hospitales o de cuerpos policiales.
El uso de indicadores empíricos vinculados a conceptos abstractos. Se combina con otros instrumentos, como vincular indicadores de tristeza al concepto de depresión.
En este punto es importante entender que existe una gran diferencia entre los instrumentos que piden a los participantes opiniones o percepciones, como las escalas o cuestionarios, y los instrumentos que registran respuestas directas, como las pruebas estandarizadas, por ejemplo, sobre inteligencia, o los aparatos que miden las respuestas cerebrales.
Eso no quiere decir que no sea válido utilizar las opiniones o percepciones de los participantes, pero en ese caso, tenemos que tener claro que las conclusiones a las que lleguemos serán sobre la opinión o percepción de un tema; nunca algo objetivo sobre el tema en sí.