Statistique inférentielle et psychométrie appliquée

Cette grande leçon introduit la statistique inférentielle et la psychométrie appliquée, ceci dans la  perspective de permettre aux étudiants de comprendre les enjeux épistémologiques, scientifiques et techniques de ces matières. Ces enjeux comprennent en particulier la mise au point de méthodes objectives pour l’étude de la variabilité induite expérimentalement ou observée en condition naturelle.

Cette leçon est essentielle pour comprendre les suivantes, car tous les concepts de base de la statistique inférentielle y sont expliqués.

7. L'hypothèse nulle

7.2. Utilisations de l'hypothèse nulle en statistique

2.1. Quelque chose plutôt que rien ?

Fondamentalement, le scientifique veut comprendre le monde. Le monde se donne à lui par les sens, mais les observations sont soumises à la variabilité. De sorte que comprendre le monde revient à savoir repérer et expliciter les causes à l'œuvre sous le processus de construction de la réalité observable. Mais voilà, la réalité est fluctuante et les mesures imprécises. De ce fait, quelle que soit l'observation réalisée, il existe toujours une possibilité que ce que l'on a observé ne soit que le pur fruit du hasard. Il faut donc se prémunir contre ce risque. Pour cela, une solution simple utilise la notion d'hypothèse nulle. Puisque celle-ci représente l'hypothèse que ce que l'on a observé est le pur fruit du hasard, il suffit de produire une prévision de ce qu'aurait donné le hasard puis de vérifier si les données sont suffisamment loin de cette prévision pour pouvoir conclure que quelque chose est à l'œuvre qui n'est pas le hasard.

Cette idée s'applique assez directement, par exemple, dans l'analyse du caractère truqué ou non d'une pièce. Si la pièce tombe 30 fois de suite sur pile, on imagine bien que le hasard ne prédit que très rarement la survenue d'une telle série de lancers (1 fois sur 230 séries en fait, soit quelque chose d'encore plus rare que de gagner plusieurs fois au loto !) Donc si on observe une telle série, on a une présomption très forte que quelque chose a agi qui n'était pas le hasard. Par exemple, la pièce était truquée.

Nous verrons diverses applications de cette idée générale dans le cadre des différents tests statistiques étudiés (par exemple test de comparaisons de moyennes, test du Chi², ...). 


2.2. L'hypothèse nulle pour générer des expériences cruciales

Les philosophes ont depuis longtemps théorisé les mécanismes permettant l'induction, c'est-à-dire le processus par lequel on infère une cause générale à partir de l'observation d'effets particuliers. L'induction est un mode de raisonnement problématique, contrairement à la déduction. Cette dernière, sous réserve que les prémisses du raisonnement soient justes, et que le raisonnement ne soit pas entaché d'erreur, aboutit à une conclusion absolument certaine. L'induction n'offre pas cette garantie. Pour le dire simplement, le problème vient de ce que pour un ensemble d'observations données, il est possible de construire une infinité de modèles explicatifs pouvant éventuellement être incompatibles entre eux ! C'est pourquoi les scientifiques se trouvent souvent face à deux théories contradictoires (ou plus !). Ils doivent alors imaginer une situation telle que les prédictions des deux théories diffèrent. Il faut ensuite aller voir comment la réalité se comporte pour trancher en faveur de l'une ou l'autre théorie...

Cette stratégie, dite de l'expérience cruciale, trouve cependant sa limite lorsque l'on ne dispose pas de deux théories à opposer. Quand par exemple, lorsque l'on ne connaît encore rien sur le sujet... Que faire ?

Je peux tout simplement capitaliser sur le fait que je ne sais rien en postulant qu'en fait... il n'y a rien à savoir ! Comme aurait dit Coluche, "Allez hop ! Circulez, il n'y a rien à voir !" Autrement dit, postuler que seul le hasard est à l'œuvre dans le phénomène que j'étudie. Du coup, je peux opposer l'idée qu'il n'y a rien à savoir et l'idée que quelque mécanisme est à l'œuvre dans la construction de la situation1. Muni de ma théorie et de mon hypothèse nulle, je vais alors pouvoir comparer deux prédictions sur le devenir de la réalité : celle prévue par mon hypothèse nulle et celle prévue par la théorie.

_______________________________________________________
1.  Ce quelque chose, le chercheur aura bien sûr envie de prétendre que c'est la cause prévue par sa théorie. Mais attention : montrer que le hasard explique difficilement les données ne suffit pas à établir positivement que la théorie du chercheur est la meilleure explication !