Psychométrie

Cette grande leçon développe la problématique de la mesure en psychologie dans une perspective épistémologique et historique. Il s'agit de poser le problème de l'observation objective et quantitative du comportement d'une part, et le problème de l'interprétation des données comme des variables théoriques d'autre part.

Rédaction : Stéphane Vautier

6. Un test psychométrique est-il valide ?

6.4. Validation de construit

La notion de validation de construit entre en jeu lorsque le psychologue utilise le test pour mesurer un construit.

"Un construit est un attribut humain que l'on postule, et dont on suppose qu'il est reflété par la performance au test" (Cronbach & Meehl, 1955, p. 283).  

Selon cette perspective, on fait l'hypothèse d'une réalité quantitative sous-jacente au test. En particulier, on considère que les différences individuelles qui existent au niveau du construit expliquent la variabilité observée avec le test. On retrouve aussi l'idée que les réalités mesurables en psychologie sont moins nombreuses que les tests pour les mesurer, les construits étant définis à un niveau d'abstraction ou de généralité plus élevé que les tests (cf. Qu'est-ce que la psychométrie ?).


Exemple : un test mesure-t-il l'ambition universitaire ou bien l'anxiété ?  

Nous allons utiliser l'exemple de Cronbach et Meehl (1955) en le développant à notre guise. On considère l'énoncé particulier

  • P1 : Le test A mesure le niveau d'anxiété.

Le problème est de savoir si une telle proposition est valide. On pourra s'appuyer sur les éléments "théoriques" suivants :

  • P2 : L'anxiété est un trait de personnalité plus ou moins marqué selon les personnes.
  • P3 : Le niveau d'anxiété est associé positivement avec le niveau de réactivité émotionnelle.
  • P4 : Le niveau de réactivité émotionnelle peut être mesuré avec un galvanomètre dans une situation expérimentale (un galvanomètre est un instrument mesurant un très faible courant électrique).
  • P5 : Un haut niveau de réactivité émotionnelle sature les capacités cognitives (attention, mémoire à court terme).
  • P6 : La saturation des capacités cognitives se traduit par une baisse de la performance à un test de mémoire.

On considère maintenant un groupe d'étudiants ayant passé un examen, à qui on annonce individuellement qu'ils ont échoué. On enregistre immédiatement leur réaction émotionnelle à l'aide d'un galvanomètre. On déduit de la "théorie" que les mesures galvanométriques et les scores au test A sont positivement liés. Un résultat contraire indiquerait que "quelque chose cloche" dans la théorie, ou bien que P1 n'est pas valide.

On s'intéresse maintenant à une mesure d'inefficience mnésique induite après un choc électrique. À nouveau, la théorie permet de déduire que les scores au test A doivent être positivement associés aux mesures d'inefficience mnésique.

On complète la théorie avec la proposition suivante :

  • P7 : Le niveau d'anxiété est associé positivement avec l'acuité du sentiment de tension ou de nervosité.

Cette proposition permet de déduire qu'une mesure du sentiment de tension doit être positivement associée au score au test A. Comme précédemment, un résultat contraire indiquerait que la théorie n'est pas valide ou bien que la proposition P1 n'est pas valide. L'observation d'une association positive entre les deux variables corrobore à la fois la théorie et la proposition P1.

L'accumulation de faits empiriques qui corroborent P1 n'est pas suffisante. Encore faut-il exclure des interprétations alternatives. Par exemple, comment exclure la proposition suivante : 

  • P'1 : Le test A mesure le niveau d'ambition universitaire.

En effet, il semble logique que l'annonce d'un échec scolaire affecte d'autant plus les étudiants qu'ils ont un haut niveau d'ambition scolaire. L'association entre les scores au test A et les mesures galvanométriques peut donc être expliquée par P'1 aussi bien que par P1.

Ajoutons les propositions suivantes à la théorie :

  • P8 : Le niveau socio-économique est positivement associé au niveau d'ambition universitaire
  • P9 : Le niveau socio-économique n'est pas associé au niveau d'anxiété.

Si le test A mesure le niveau d'ambition universitaire, les scores au test doivent être positivement associés au niveau socio-économique. Si le test mesure le niveau d'anxiété, les scores au test et le niveau socio-économique ne doivent pas être associés. L'observation d'une faible association statistique entre les deux variables permettra d'écarter la validité de P'1.


Documentation empirique de la validité de construit

Dans la doctrine de la validité, un construit est localisé dans le domaine de la réalité non directement observable, au même titre, selon certains auteurs, qu'un électron par exemple. Toutefois, son statut quantitatif est admis de manière préalable, puisqu'il se mesure à l'aide d'un test, instrument de codage numérique des comportements (cf. Score psychométrique). Par exemple, si l'anxiété est définie comme un trait psychologique, si ce trait est susceptible d'introspection guidée par un questionnaire, on peut proposer un test pour mesurer la manière dont les personnes diffèrent quantitativement sur ce trait. La variance observée avec le test sera interprétée comme un effet de la variabilité du niveau d'anxiété dans la population à laquelle est appliqué le test.

Pour étayer ce type d'interprétation, on développe un ensemble de propositions ou d'énoncés qui relient le construit à d'autres concepts ou observables, formant ainsi ce que l'on appelle un "réseau nomothétique" (nomothétique : "dont l'objet et la méthode permettent d'établir des lois générales ou universelles, représentées par des relations constantes entre les phénomènes observés", Le Trésor de la Langue Française Informatisé). Par exemple, les énoncés P2 à P9 sont constitutifs du réseau nomothétique dans lequel s'inscrit le concept d'anxiété. Supposons que l'on affirme maintenant que tel test mesure l'anxiété. Grâce au réseau nomothétique, cette affirmation peut donner lieu à un certain nombre de vérifications empiriques.

La doctrine de la validité de construit se fonde sur l'espoir que la vérification empirique de la validité des propositions développées au niveau nomothétique permettra d'éliminer les conceptions naïves et de favoriser l'émergence de conceptions plus cohérentes de ce que mesurent les tests.