Score psychométrique

Site: IRIS - Les cours en ligne de l'UT2J
Cours: UOH / Statistique et Psychométrie en L1
Livre: Score psychométrique
Imprimé par: Visiteur anonyme
Date: jeudi 9 mai 2024, 01:04

Description


Objectifs. Définir la notion de score psychométrique (ou psychologique). 
Prérequis.  Qu'est-ce qu'un test psychométrique ?

Utilisé comme prérequis dans les articles :

Résumé. "Les scores psychométriques sont des nombres privés d'unité de mesure obtenus par codage numérique des comportements observés avec des tests ou des questionnaires psychologiques, ou toute situation d'observation standardisée, et dont la finalité est d'être interprétés comme mesures d'attributs psychologiques" (Vautier, 2008, p. 6).

rédaction : Stéphane Vautier

1. Codage numérique des comportements observés

Étant donné un test, on distingue les scores élémentaires, associés à un item particulier du test, et les scores composites, associés à un sous-ensemble d'items (une échelle) du test ou à l'ensemble du test.


Par définition, le comportement observé avec un test psychométrique n'est pas une grandeur mesurable. Le comportement n'est ni une distance, ni une masse, ni une intensité électrique, etc. Pour traduire le comportement observé au test en un score psychométrique, il faut utiliser une application, dont l'ensemble de départ comprend tous les comportements observables avec le test, dont l'ensemble d'arrivée comprend des nombres, et qui attribue un nombre unique à tout comportement de l'ensemble de départ. Cette application est définie par convention.

2. Score élémentaire

Un score élémentaire est le score que l'on peut attribuer à la réponse à un item de test. Ci-dessous se trouve un exemple d'item de l'inventaire d'anxiété trait-état de Spielberger et al. (1993). Cet inventaire comprend deux échelles, associées à deux construits, respectivement nommés anxiété-état et anxiété-trait.

bla

Item du questionnaire d'anxiété trait-état de Spielberger

L'application qui définit le codage numérique des réponses à cet item est la suivante : 

bla

Ces scores expriment une hiérarchisation des réponses, un "Non" étant considéré comme reflétant davantage d'anxiété qu'un "Plutôt non", et ainsi de suite. Remarquons que la relation d'ordre définie par cette application peut être obtenue à l'aide d'une autre application, définissant le codage numérique des réponses, comme par exemple :

bla

Le choix d'une application plutôt qu'une autre parmi une infinité d'applications possibles est fixé par l'usage. 

3. Score composite

On considère à présent un test composé de m items. Le score composite y d'une personne particulière est obtenu par une fonction composant les scores élémentaires obtenus par cette personne aux m items du test. On peut écrire cela formellement de la manière suivante :

y=f(y_1,y_2,\ldots,y_m)

Généralement, cette fonction de composition numérique consiste à faire la somme des scores élémentaires. Par exemple, le score d'anxiété-état obtenu à l'inventaire de Spielberger et al. est la somme des 20 scores élémentaires obtenus aux items de l'échelle d'anxiété-état.

Une autre façon équivalente de définir un score composite est de construire directement l'application qui relie (i) l'ensemble des patrons de réponse à tous les items entrant en ligne de compte dans la formule du score à (ii) l'ensemble des nombres. En pratique, cette approche n'est pas utilisée, du fait du nombre astronomique de patrons de réponses qu'il faudrait considérer pour définir l'ensemble de départ de manière exhaustive.

Pour illustrer l'ampleur de l'application qui sous-tend un score composite, considérons les 20 items de l'échelle d'anxiété-état de l'inventaire de Spielberger et al. Quel est le cardinal de l'ensemble de départ, c'est-à-dire de l'ensemble de tous les patrons de réponses aux 20 items ? On peut en faire le dénombrement de la façon suivante :

  • les quatre possibilités de réponse au premier item se combinent aux quatre possibilités de réponse au second item, ce qui donne 16 patrons de réponses possibles ;
  • ces 16 patrons de réponses se combinent aux quatre possibilités de réponse du troisième item, ce qui donne 43 patrons de réponses possibles ;
  • et ainsi de suite jusqu'au vingtième item, ce qui donne 420, soit plus de 1000 milliards de possibilités.

Quel est le cardinal de l'ensemble d'arrivée ? Le nombre de scores contenus dans l'ensemble d'arrivée dépend des scores minimum et maximum possibles. Le score minimum correspond à la somme des plus petits scores, soit 20 points ; le score maximum correspond par la somme des plus grands scores, soit 80 points. Les scores possibles sont les entiers compris entre 20 et 80 inclus, on a donc 80 - 20 + 1 = 61 scores possibles.

Finalement, le score composite est défini par une relation qui à tout patron de réponses parmi 420 associe un seul score entier compris entre 20 (score minimum) et 80 (score maximum) points. 

4. Le statut conventionnel de mesure d'intervalle des scores composites

On a vu dans l'article Qu'est-ce qu'un test psychométrique ? que les premières définitions limitaient la fonction des scores à des besoins de classement objectif des individus. De manière plus contemporaine, les scores composites ne sont pas considérés comme de simples scores spécifiques au test dont ils dépendent. Ils sont généralement utilisés comme des mesures valides de grandeurs putatives ou construits (voir la notion de validité de construit). Par exemple, un score de QI n'est pas utilisé comme un score spécifique à tel ou tel test dit d'intelligence, mais comme une mesure valide de l'intelligence, c'est-à-dire d'une grandeur qui peut être mesurée avec différentes variantes de tests d'intelligence. De même, un score d'anxiété-état est interprété comme une mesure valide de l'intensité de l'état anxieux de la personne ayant répondu aux items de l'échelle d'anxiété-état, ce que Falissard (2001) appelle une mesure subjective. En tant que telle, l'anxiété-état est un construit, c'est-à-dire une grandeur hypothétique que l'on peut mesurer avec des questionnaires d'anxiété-état.

La variabilité observée à l'aide des scores est interprétée comme une variation relative à la grandeur que l'on veut mesurer avec le test. D'où la question de la nature de la relation entre les scores observés et la grandeur que l'on veut mesurer. On convient que la variable des scores observés est approximativement une fonction affine de la variable putative. En d'autres termes, on convient que deux écarts égaux mesurés à des niveaux très différents de l'échelle des scores au test représentent une variation réelle de même amplitude. Par exemple, sur l'échelle des scores de QI, on considère que l'écart entre 75 et 85 représente la même variation d'intelligence que l'écart entre 125 et 135. Selon la classification des niveaux de mesure de Stevens ( 1946 ), les scores composites sont considérés comme des mesures d'intervalle.