Confiabilidad y Validez



CONFIABILIDAD

Como mencionamos anteriormente, es importante que cualquier instrumento sea válido y confiable al momento de recolectar información. 

La confiabilidad se puede definir como la estabilidad o consistencia de los resultados obtenidos( Pick & López, 2000). Nos permite saber que tan consistentes, exactos y estables son nuestros resultados al aplicar un instrumento.

Existen varios métodos por los cuales podemos comprobar la confiabilidad en los instrumentos:

  • Confiabilidad Test-Retest: Morales (2007) explica que en esta los sujetos responden dos veces al mismo test, dejando entre las dos veces un intervalo de tiempo. El coeficiente de correlación entre las dos ocasiones es lo que denominamos coeficiente de fiabilidad test-retest.  
  • Confiabilidad de formas alternadas o alternas: Se realiza cuando existen dos versiones o formas alternas del mismo instrumento. Para comprobar la confiabilidad se aplica el instrumento una vez, y para la segunda aplicación, en vez de usar el mismo instrumento se utiliza la forma alterna del mismo, se toman los resultados de ambas aplicaciones y se coorelacionan los resultados entre sí (Pick & López, 2000). 
  • Confiabilidad Split- Half:  Se aplica el test una sola vez a una muestra. Luego, se califica por separado los ítemes pares (2, 4, 6, ..., n) y los ítemes impares (1, 3, 5, ..., n). A continuación, las dos series de puntajes resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido el test en dos partes (ítemes pares e ítemes impares), el "r" resultante debe ser "corregido" para arrojar el "r" para todo el test. (Aliaga, ) 
  • Confiabilidad por medio del coeficiente alpha (Cronbach, 1949): Este tipo de confiabilidad requiere de una sola aplicación del instrumento y se basa en la medición de la consistencia de la respuesta del sujeto con respecto a los ítems del instrumento. (Pick & López, 2000).


VALIDEZ.

Es otro aspecto a considerar al momento de elaborar cualquier instrumento. 

Elousa (2003) considera la validez como el aspecto de la medición psicopedagógica vinculado a la comprobación y estudio de las puntuaciones obtenidas por el test.


La validez aplicada a una prueba, es un juicio o estimación acerca de que tan bien una prueba mide lo que pretende medir en un determinado contexto (Cohen & Swerdlik, 2006). El término de validez no debe confundirse con la validación, ya que este último se refiere al proceso de recopilar y evaluar la validez de la evidencia.

Existen diferentes tipos de validez, pero antes expondré un resumen sobre una panorámica general sobre este concepto.



Tipos de validez.

De contenido. Se refiere al contenido del instrumento. En la psicología generalmente se utiliza para saber si nuestro instrumento tiene validez de contenido, debemos saber si abarca adecuadamente aspectos importantes de la conducta que estamos midiendo.
En otras palabras, es el grado en el que la medición representa el concepto medido.

De criterio.  Un criterio se define como el modelo contra el cual se compara y evalúa una prueba o puntuación de una prueba. Por lo tanto, la validez de criterio establece la validez de un instrumento de medición comparándola con algún criterio externo. Este criterio es un estándar con el que se juzga la validez del instrumento. Entre los resultados del instrumento de medición se relacionen más al criterio, la validez del criterio será mayor.

Concurrente. Es una forma de validez relacionada con el criterio, indican el grado en el cual una prueba pueden servir para estimar la posición actual de un individuo frente a un criterio.

Predictiva. Si el criterio se fija en el futuro se habla de validez predictiva. Supongamos por ejemplo, que utilizamos un test para evaluar las habilidades necesarias para realizar un trabajo determinado. La valivez de criterio consiste en comparar los resultados del test con el desempeño en el trabajo en cuestión. Si las personas obtienen una puntuación alta en el test son los que mejor realizan dicho trabajo, entonces el test tiene una alta validez de criterio, y como ya quedo claro, existen dos formas de conocer la validez de criterio.

1. Validez predictiva:  Consiste en administrar el test a los candidatos, luego contratarlos a todos y más tarde, cuando conozcamos el rendimiento de cada persona se comparan las puntuaciones en el test con su desempeño en el trabajo para ver hasta qué punto se correlacionan.

2. Validez concurrente.  Consiste en administrar el test a los trabajadores ya contratados y comparar sus tesultados con su ejecución en el trabajo. 

De constructo. Un constructo es una idea informada, científica, desarrollada como una hipótesis para describir o explicar el comportamiento, en otras palabras es un concepto elaborado por los teóricos de la Psicología para explicar el comportamiento humano como por ejemplo la inteligencia, motivación, asertividad, etc. son constructos que forman parte de teorías psicológicas y que precisan de indicadores observables para su estudio. En muchas ocasiones  estos indicadores son los ítems de un test, y debe comprobarse empíricamente que resultan adecuados para reflejar el constructo de referencia.
Definimos calidez de constructo como un juicio acerca de lo apropiado de las inferencias realizadas a partir de las puntuaciones o calificaciones obtenidas en la prueba, respecto a posiciones individuales en un constructo.

Cohen (2006) Nos ofrece un claro ejemplo:
"El investigador que analiza la validez de constucto de una prueba debe formular varias hipótesis acerca del comportamiento esperado en quienes obtienen puntajes bajos en la prueba. Estas hipótesis darán origen a una teoría tentativa sobre la naturaleza del constructo para cuya medición fue diseñada la prueba. Si la prueba es una medida válida del constructo, quienes obtuvieron puntajes altos y quienes obtuvieron puntajes bakos se comportarán como la teoría predice."

Ecológica.  Aparte de los test, en la evaluación y diagnóstico del habla tenemos que hablar y observar al paciente según se desenvuelve en su entorno diario. En esto consiste la validez ecológica delos datos, en los ue los datos provengan de stuaciones naturales en el desarrollo del habla de la persona.

La validez ecológica se refiere a la medida en la que el ambiente de los sujetos experimentan en una investigación científica tiene las propiedades que el investigador piensa o supone que tiene (Bronfenbrenner, 1979).

Factorial. El análisis factorial se realiza con dos objetivos: 1) determinar cuál es el número de dimensiones o factores que mide un test y descubrir cuál es el significado de cada una; 2) obtener una puntuación de cada sujeto en cada dimensión.  2) obtener la puntuación de cada sujeto en cada dimensión.

Convergente. Si dos test miden un mismo rango, la correlación entre ellos debe ser alta.

Discriminante. Si dos test miden rasgos diferentes, la correlación entre ellos debe ser baja, o al menos menor que otro test que mida lo mismo.

Facie. Es cuando los reactivos parece que miden lo que se supone que tienen que medir.


NOTA:

  • Todo instrumento válido es confiable pero...
  • No todo instrumento válido es confiable.
Por ejemplo la persona que predice el clima siempre que dice que lloverá, no llueve y cuando dice que no lloverá, llueve. Por lo que se considera que lo que dice es Confiable (ya que sabremos que siempre se equivoca) pero no válido (ya que no ocurre lo que predice).




.






REFERENCIAS:


Aliaga, T. (S/f). Psicometria: Test psicométricos, confiabilidad y validez. Recuperado el 1 de mayo del 2013 de http://www.uigv.edu.pe/facultades/psicologia/recursos/05LibroEAPAliaga.pdf 

Elousa, P.(2003). Sobre la validez de los test. Psicothema, 15 (2), 315-321 Recuperado de http://www.psicothema.com/pdf/1063.pdf

Morales, V. (2007).La fiabilidad de los test y escalas. Recuperado de el 1 de mayo del 2013 de http://www.upcomillas.es/personal/peter/estadisticabasica/Fiabilidad.pdf

M. R. Pablo. (2008). Glosario: Validez Ecológica. Recuperado el 1 de mayo del 2013 de http://pauls.blogs.uv.es/2008/10/23/glosario-validez-ecologicade-los-datos/

Pick, S. & López A. (2000) Cómo investigar en ciencias sociales. México: Trillas.

Selección personal: los test psicológicos.(s/f). Recuperado el 1 de mayo del 2013 de http://www.cepvi.com/trabajo/test2.shtml
Comments