Psychologie, statistique et psychométrie

Cette première grande leçon introduit la psychométrie et la statistique dans la perspective historique du développement de la psychologie scientifique à partir du XIX e siècle, afin de permettre aux étudiants de comprendre les enjeux épistémologiques, scientifiques, et techniques de ces matières. Ces enjeux comprennent en particulier l'établissement de grandeurs mesurables et la mise au point de méthodes objectives pour l'étude de la variabilité induite expérimentalement ou observée en condition naturelle.

Rédaction : Éric Raufaste, Stéphane Vautier

5. Quantification de la variabilité

5.2. Individus, Populations, Échantillons

Notion d'individu

Étymologiquement, le terme individu renvoie aux racines latines in- et  dividere , autrement dit « que l'on ne peut pas diviser ». On voit par là que l'individu est à la psychologie ce qu'est l'atome à la physique. Mona Lisa est un individu unique, distinct de tous les autres individus humains, que l'on peut reconnaître sans hésiter. Chaque individu humain est ainsi unique. Bien entendu, de même que les physiciens parviennent ensuite à décomposer l'atome en particules, on peut aussi décomposer l'individu (ou son système cognitif, puisque nous sommes en psychologie) en sous-parties qui peuvent elles-mêmes faire l'objet d'analyses.

Le terme technique qui capture l'idée d'individu dans le vocabulaire de la statistique est l'unité statistique. Ainsi, nous pouvons intégrer diverses informations au sujet d'une même unité statistique et ces informations auront en commun de décrire la même unité, le même individu. 

L'usage en psychologie tend à abandonner l'habitude consistant à qualifier l'individu de « sujet », afin de faire référence à la personne en tant qu'elle n'est pas seulement un objet d'étude inerte, mais un individu auto-déterminé, autonome, capable d'une pensée propre et capable d'agir sur le monde. Cette tendance s'intensifie, comme en témoigne la récente introduction dans les normes de publications de l'APA (American Psychological Association) d'une règle selon laquelle on ne doit plus dans les articles scientifiques, qualifier les personnes qui participent aux expériences comme des "sujets", mais comme des "participants". Ce qui a le mérite de rendre claire la distinction entre les personnes humaines, incarnées, étudiées lors des expériences, et le sujet, idée abstraite, objet du discours produit par la science psychologique.



L'individu, sujet réel ou sujet idéalisé ? 

En abordant la question de l'individu et de la population, il nous semble difficile d'ignorer un sujet qui fait encore parfois débat dans la communauté des psychologues : le rapport entre le statut du sujet et l'utilisation des statistiques.

Nous l'avons dit, la psychologie traite du sujet. Mais il faut distinguer la psychologie en tant que pratique clinique, celle où le praticien reçoit un patient dans son cabinet et traite cet individu dans ce qu'il a d'unique, et la psychologie en tant que science, où le chercheur vise à produire des connaissances valables pour tous les sujets humains, ou au moins pour certains groupes de sujets. De ce fait, lorsque l'on parle du sujet en psychologie scientifique, on parle d'un sujet idéalisé, un sujet reconstruit dans un univers de discours et non pas de monsieur X, en chair et en os, que l'on a devant nous. C'est ce qui fait dire à certains psychologues de sensibilité plus orientée vers la clinique que « les statistiques perdent le sujet ». Au point que certains rejettent l'usage des statistiques.

En réalité, les connaissances générales produites sur la population humaine, ou sur le sous-groupe d'humains dont monsieur X fait partie (« les hommes », par exemple) s'appliqueront généralement AUSSI à monsieur X. C'est tout l'intérêt appliqué de la recherche scientifique en psychologie ou en médecine : même si le clinicien est dans une logique qui ne requiert ni l'usage de statistiques ni de considérer un sujet idéalisé, il va bénéficier pour sa pratique des connaissances développées par les chercheurs, dont certaines trouveront à s'appliquer au cas particulier de son patient. Le clinicien utilise les connaissances générales développées par le chercheur. À ce titre, il n'a pas besoin des statistiques. Mais le chercheur, lui, a besoin des statistiques pour étayer les connaissances générales qu'il produit, et qui seront ensuite utilisées par le praticien. Le processus mental de pensée du chercheur est fondamentalement de produire un discours général capable d'expliquer, et même de prédire, des données observées dans le monde réel. C'est une approche dite inductive et les statistiques sont là pour l'aider à évaluer la qualité de son processus mental. Le processus mental du diagnosticien est différent : il s'appuie sur les connaissances générales développées par le chercheur, et sa tâche est de trouver à l'appliquer au cas particulier qu'il a devant lui. Il n'a donc aucune visée de généralisation et les statistiques ne peuvent rien pour lui, sinon à la rigueur pour le guider vers certaines hypothèses (les plus fréquentes) plutôt que vers d'autres.

Donc cela étant posé, il doit être clair que nous cherchons à produire une description du sujet humain, et que cette description est celle d'un individu appartenant à la population humaine globale, ou à l'un de ses sous-groupes.


Notions de population et d'échantillon

Par définition, une population est tout simplement un ensemble d'individus qui partagent une certaine caractéristique. Par exemple, la population française est l'ensemble des individus qui possèdent la nationalité française. En première intention, la psychologie étudie la population des organismes biologiques capables, à un degré ou à un autre, d'une certaine autonomie dans la production de leurs comportements. Mais bien sûr, on peut étudier des populations bien plus restreintes : la population des primates, la population des humains, celles des femmes, des adolescents... En général, dans la recherche, le chercheur va définir sa population à partir d'une caractéristique, ou d'un ensemble de caractéristiques, qui l'intéresse. La population étudiée sera l'ensemble des individus chez qui cette caractéristique a pour valeur la modalité souhaitée. Ainsi, la population d'un chercheur qui s'intéresse à la motivation chez les femmes sera l'ensemble des individus humains dont la modalité de la variable « sexe » est « féminin ».

Dans la plupart des cas,  il ne sera pas possible d'étudier tous les individus de la population cible, pour des raisons évidentes de quantité de mesures à faire, de personnes à contacter... Si l'on veut produire des connaissances sur tous les humains, une population mondiale de plus de huit milliards de personnes disqualifie d'emblée cette possibilité. Le chercheur est donc obligé de recueillir des informations sur un sous-ensemble de la population cible, un échantillon, c'est-à-dire un sous-ensemble d'individus choisis pour leur représentativité. Le chercheur pourra alors produire des connaissances sur cette sous-population en espérant que les connaissances générées se généralisent bien au reste de la population cible.

Ces définitions étant posées, il nous faut maintenant introduire d'autres concepts qui vont nous permettre de décrire plus finement les individus, et aussi de dégager des points communs entre individus et ainsi formaliser les critères d'appartenance à une population. Ce sont les notions de variables, valeurs et modalités qui vont nous y aider.