La validez informa sobre el grado en que realmente una prueba (test) mide el objetivo o el rasgo que pretende medir. Este aspecto es importante porque la distancia entre el objeto a medir y el instrumento de medición suele ser tan amplia que la relación entre ambos no es evidente, y de aquí la necesidad de contar con estrategias que indiquen ese grado.
Tipos de validez:
- Validez de contenido. Determina el grado en que la muestra de ítems del test es representativa del rasgo que se pretende medir. Los procedimientos habituales para justificar la validez de contenido son:
- la elaboración de un tabla de especificación donde se relaciona cada ítem con el objetivo específico que mide, y
- el juicio de expertos que valoran la propiedad de cada ítem para medir los objetivos propuestos.
- Validez de criterio. Se plantea cuando se desea estudiar la relación entre el test y alguna otra conducta externa a la prueba, pero con la cual se supone que mantiene algún tipo de relación. El procedimiento es el cálculo de la correlación entre las puntuaciones obtenidas en el test y las puntuaciones obtenidas en el criterio externo. Se puede diferenciar este tipo de validez en función del tiempo que transcurra entre la aplicación del test y la medición del criterio externo, así, si transcurre un espacio de tiempo relativamente largo, se habla de validez predictiva y en caso contrario se habla de validez concurrente.
- Validez de constructo. Determina el grado en que el test mide el rasgo teórico al que se refiere. De esta manera se pone a prueba la teoría básica que sustenta el constructo medido. Los procedimientos para comprobar este tipo de validez son diversos y complejos aunque uno de los más usuales es el análisis factorial.
Los factores que afectan a la validez de criterio se pueden resumir de la siguiente manera:
- La fiabilidad. La validez está directamente relacionada con la fiabilidad, de tal manera que una baja fiabilidad dificulta que se pueda hallar una alta validez de criterio. De hecho, dado que el criterio sólo puede correlacionar con la varianza verdadera o sistemática, el valor máximo teórico de la validez de criterio se corresponde con la raíz cuadrada del coeficiente de fiabilidad.
- La homogeneidad del contenido de los ítems. Un test que mida muchas variables o rasgos diferentes será más fácil que correlacione con algún criterio externo.
- La homogeneidad de las puntuaciones del test. Si se disminuye la varianza de las puntuaciones del test, también se disminuye la varianza sistemática y por tanto no podrá correlacionar tanto con otras puntuaciones.
Algunos autores como Brualdi (1999) o Messick (1989, 1996a y 1996b) han llamado la atención sobre la poca significación que tiene el concepto tradicional de validez para la práctica. Como solución proponen un concepto de validez más moderno y unificado que ponga el énfasis en el uso y mejora de los tests, más en sintonía con los estándares para la evaluación de programas del Joint Committee on Standards for Educational Evaluation. Los seis aspectos que aportan más evidencias de validez, según estos autores, son:
- Identificar bien el contenido. Hoy día, cuando se quiere medir un aprendizaje complejo se tiende a aumentar la dificultad de los ítems, cuando lo que habría que hacer es definir mejor el constructo que se está midiendo.
- Fundamentar teóricamente. El uso de teorías sustantivas sobre el dominio que se pretende medir permite realizar un buen muestreo de los ítems necesarios.
- Estructurar la forma de puntuar. La estructura del sistema de puntuación debería ser consistente con la estructura interna del constructo que se está midiendo.
- Aportar evidencias de generalizabilidad. La interpretación de las puntuaciones debería poder ser generalizable al constructo que se está midiendo.
- Reflejar las relaciones con factores externos. La interpretación de las puntuaciones también debería reflejar la relación que existe con otras medidas o conductas. De esta manera se demuestra el carácter sistémico de la realidad social.
- Explicitar las consecuencias. Se deben aportar evidencias de las consecuencias positivas y negativas que pueden acarrear las interpretaciones y los usos de las puntuaciones de un test.