Statistique inférentielle et psychométrie appliquée

Cette grande leçon introduit la statistique inférentielle et la psychométrie appliquée, ceci dans la  perspective de permettre aux étudiants de comprendre les enjeux épistémologiques, scientifiques et techniques de ces matières. Ces enjeux comprennent en particulier la mise au point de méthodes objectives pour l’étude de la variabilité induite expérimentalement ou observée en condition naturelle.

Cette leçon est essentielle pour comprendre les suivantes, car tous les concepts de base de la statistique inférentielle y sont expliqués.

9. La décision statistique

9.3. Un pari pour ou contre l'hypothèse nulle

Puisque face à tout résultat observé, on peut donner au moins une autre explication que celle postulée par le chercheur lorsqu'il a construit son expérience, ce dernier ne peut se contenter d'avoir observé l'effet, même si celui-ci va dans le sens qu'il attendait. Dans notre exemple, le chercheur qui a observé une meilleure capacité d'attention dans le groupe contrôle doit décider si ce résultat correspond à une réalité répétable ou s'il ne s'agit que d'un pur effet du hasard, à savoir l'hypothèse nulle. Cette décision est ce que l'on appelle la décision statistique ou encore "statistique inférentielle", ou encore "inférence statistique".

Classiquement, qui dit analyse de décision dit analyse des enjeux. La décision statistique ne fait pas exception à cette règle. La décision statistique est affaire de science. Autrement dit, il s'agit de produire de connaissances. Puisque le scientifique doit convaincre ses pairs de la rationalité de sa décision, il lui faut trouver des arguments solides pour justifier qu'il choisit son hypothèse expérimentale ou bien l'hypothèse nulle pour expliquer les résultats. Mais les conséquences de l'hypothèse expérimentale et de l'hypothèse nulle ne se posent pas toujours aussi simplement qu'en termes de "réalité" ou "fausseté" d'une hypothèse intellectuelle...

Par exemple, imaginons des décideurs qui doivent décider de relancer ou non un programme nucléaire après une catastrophe type Fukushima, Tchernobyl, ou Three Miles Island. Les faits observés sont qu'en 50 ans plusieurs accidents majeurs sont arrivés sur la planète. L'hypothèse nulle serait donc que des causes inconnues et imprévues interviennent de temps à autre pour causer une catastrophe que l'on n'avait pas vu venir.

Dans ce cas particulier, les tenants du nucléaire essaieront de défendre l'idée que les accidents sont dus, non pas au hasard (celui-ci étant incontrôlable, les accidents seraient susceptibles de se reproduire) mais à des causes entièrement contrôlables et que justement l'on saura contrôler. Au contraire, les antinucléaires vont plutôt défendre l'hypothèse nulle, à savoir que l'on ne contrôle pas tout et que la probabilité d'occurrence des accidents observée jusqu'ici permet de prédire plusieurs autres accidents majeurs dans les 50 ans à venir si l'on ne change pas de technologie...

Tout l'objet des cours de statistique inférentielle est de vous enseigner comment prendre ce type de décision de la façon la plus rigoureuse possible. Apprendre à bien décider en quelque sorte.

Pour bien décider entre deux hypothèses, il faut s'intéresser à deux choses. La plausibilité de chaque hypothèse d'une part, et, l'exemple du nucléaire nous le montre, il faut évidemment prendre en compte l'ampleur des conséquences potentielles de la décision. Commençons par regarder comment ces dernières sont analysées.