Statistique inférentielle et psychométrie appliquée

Cette grande leçon introduit la statistique inférentielle et la psychométrie appliquée, ceci dans la  perspective de permettre aux étudiants de comprendre les enjeux épistémologiques, scientifiques et techniques de ces matières. Ces enjeux comprennent en particulier la mise au point de méthodes objectives pour l’étude de la variabilité induite expérimentalement ou observée en condition naturelle.

Cette leçon est essentielle pour comprendre les suivantes, car tous les concepts de base de la statistique inférentielle y sont expliqués.

9. La décision statistique

9.5. Les risques de type I et II

Le monde dans lequel nous nous trouvons réellement n'est pas connu lorsque nous faisons ce pari. C'est précisément pourquoi c'est un pari. Au minimum, on peut néanmoins supposer que notre hypothèse nulle, si elle est formulée scientifiquement, ne pourra avoir qu'une et une seule de deux valeurs de vérité possibles : elle sera soit vraie, soit fausse.

D'un autre côté, les éléments de preuve que nous avons à notre disposition (les "faits probants"), qui en général consistent en une valeur numérique produite par un test statistique (valeur z, valeur t de Student, \chi^2, etc.) rendent  l'hypothèse nulle plausible ou bien non plausible.

Les différents cas qui se présentent à nous sont donc :

  • d'une part, l’hypothèse nulle (généralement notée H0) est vraie (le hasard suffit à expliquer les résultats) ou fausse (un effet systématique a causé les résultats).
  • D'autre part, le test statistique peut donner un résultat compatible avec H0 (suggérer que H0 est vraie) ou incompatible avec H0 (suggérer que H0 est fausse).

En croisant ces deux constats, on obtient le tableau à quatre cases suivant :

Tableau de décision statistique
Réalité
H0 est vraie H0 est fausse
Décision      H0 est acceptée   OK     Erreur de type II    
     H0 est rejetée     Erreur de type I     OK


Deux cas ne posent aucun problème d'un point de vue épistémique*, à savoir lorsque le test dit que H0 est fausse et que c'est vraiment le cas, ou au contraire lorsque le test dit que H0 est vraie et que c'est vraiment le cas (cases marquées d'un OK).

En revanche, on appelle

  • risque alpha (aussi noté α) le cas où l'hypothèse nulle est vraie, mais que le test conduit à la rejeter. C'est-à-dire commettre ce qui s'appelle l'erreur de type I
  • risque beta (aussi noté β) le cas où l'hypothèse nulle est fausse, mais que le test conduit à l'accepter. C'est-à-dire commettre ce qui s'appelle l'erreur de type II.

* Dans un monde épuré... Car dans la "vraie vie", il n'y a pas que des enjeux épistémiques, mais aussi des enjeux pour les chercheurs (besoin de publier pour leur carrière), pour les entreprises qui les emploient et qui peuvent les empêcher de publier des résultats en défaveur de tel médicament, de telle méthode de production d'énergie, etc. À tel point qu'il est maintenant devenu une norme scientifique dans beaucoup de domaines de rendre publique dans l'article l'existence des "conflits d'intérêts" potentiels entre la recherche et les carrières des auteurs.