Validez
La validez es una
de las dos cualidades básicas que debe poseer un examen o, en general,
todo instrumento de medida. La otra es la fiabilidad.
Se dice que un examen es válido cuando evalúa efectivamente aquello que
pretende evaluar (por ejemplo, la motivación de un individuo o su competencia
comunicativa en una lengua). La validez, por tanto, consiste en el grado
de adecuación de una prueba -o de una de sus partes- a lo que se considera
que mide. Supone, como dice T. McNamara (2000) «hacerle un test al test».
De lo anterior se
desprenden dos características: 1) la validez de una prueba está necesariamente
ligada al propósito para el que ésta fue diseñada: una prueba válida para
un propósito puede no serlo para otro; y 2) no es un concepto absoluto:
las pruebas no son válidas o inválidas, sino válidas en mayor o menor
grado para medir lo que pretenden.
Existen distintos
métodos para determinar la validez, a los que algunos autores denominan
«tipos» de validez. Éstos pueden englobarse en tres categorías:
- Métodos internos (o tipos de validez interna): establecen la validez
de una prueba mediante el análisis de su propio contenido. Algunos de
ellos son los siguientes:
- Método de la validez aparente: permite establecer la validez
de una prueba a partir de la opinión intuitiva de individuos, incluso
no expertos -alumnos, administradores de la prueba, etc.-, sobre ella.
Aunque en ocasiones ha sido considerado un método poco científico,
resulta ser muy importante en evaluación,
porque una prueba sólo es tomada en serio por los usuarios si es percibida
como válida.
- Método de la validez racional o de contenido: permite
determinar la validez de una prueba comprobando si los ítems
de ésta contienen una muestra representativa de aquello que se pretende
medir. Así, por ejemplo, se pide a un grupo de expertos que marque
en una lista la destreza que creen que evalúa cada ítem.
- Método de la validez de respuesta: consiste en averiguar la validez
de una prueba a través de técnicas destinadas a obtener información introspectiva
de los alumnos sobre cómo han respondido a los ítems de esa prueba (p.
ej., mediante entrevistas para averiguar por qué respondieron de cierta
manera y no de otra).
- Métodos externos (también llamados tipos de validez externa, empírica
o de criterio): establecen la validez de una prueba comparándola
con los resultados obtenidos por los mismos alumnos en otras pruebas.
Esa comparación se realiza mediante instrumentos estadísticos (normalmente,
el coeficiente de correlación, que mide numéricamente el grado
en que dos conjuntos de resultados resultan coincidentes).
- Método de la validez concurrente: supone comparar los resultados
de la prueba con los de otro instrumento (examen, autoevaluación,
notas del profesor, etc.). Ambas pruebas deben evaluar a los mismos
alumnos en un mismo momento y los resultados deben poder expresarse
numéricamente para poder establecer el mencionado coeficiente de
correlación.
- Método de la validez predictiva: supone comparar los resultados
de la prueba con los de otra, que pretenda medir la misma habilidad y
que es administrada a los mismos alumnos con posterioridad a la primera.
- Método de la validez de constructo: posee atributos, tanto de los métodos internos,
como de los externos. Teniendo en cuenta que un constructo es una conceptualización
teórica sobre un aspecto del comportamiento humano que no es medible u
observable por medios directos (como ocurre, por ejemplo, con la actitud
o la comprensión auditiva), este método de validación consiste en evaluar
hasta qué punto una prueba mide los constructos sobre los que ella misma
se sustenta. Ello puede hacerse de diversas formas: solicitando a expertos
que expliciten los constructos en los que se basan los ítems de la prueba
(de forma, pues, análoga al método de validez de contenido) o mediante
métodos estadísticos (la matriz multirrasgo-multimétodo de L. F. Bachman,
el análisis factorial, etc.).
En todo caso, una
prueba no puede ser válida si no es fiable (es decir, no puede medir lo
que pretende si no puede hacerlo de forma precisa).
En cuanto al cumplimiento
del requisito de validez en la evaluación de la competencia comunicativa
de los aprendientes de segundas lenguas, éste resulta imprescindible en
todas las pruebas, pero muy especialmente en las que se administran a
una población de estudiantes numerosa y máxime si se trata de pruebas
oficiales (por ejemplo, los exámenes DELE).
Otros términos relacionados
Examen.
Bibliografía básica
- Alderson, J. C., Clapham, C. y Wall, D. (1995). Exámenes
de idiomas. Elaboración y evaluación. Madrid: Cambridge Universtiy Press, 1998.
Bibliografía especializada
- Bachman, L. (1990).
Language Testing Construction and Evaluation. Oxford: Oxford University
Press. Traducción al español. del capítulo 4 en Llobera, M. et al. (1995). Competencia
comunicativa. Madrid: Edelsa.
- Davies, A. et
al. (1999). Dictionary in Language Testing. Cambridge: Cambridge
University Press.
- McNamara, T. (2000).
Language Testing. Oxford: Oxford University Press.
Centro Virtual Cervantes © Instituto Cervantes, . Reservados todos los derechos.
cvc@cervantes.es