Savoir rédiger des résultats inférentiels (valeur p)

Site: IRIS - Les cours en ligne de l'UT2J
Cours: UOH / Statistique et Psychométrie en L2
Livre: Savoir rédiger des résultats inférentiels (valeur p)
Imprimé par: Visiteur anonyme
Date: jeudi 9 mai 2024, 03:57

Description

Objectifs : Expliquer à l'étudiant en psychologie comment il doit présenter ses résultats concernant les valeurs p. Lui apprendre à savoir interpréter les résultats qu'il pourra lire dans les articles scientifiques.

Pré-requis:

Résumé : L'article répond à des questions de base sur le nombre de décimales à utiliser, quand utiliser un point ou une virgule décimale, faut-il mettre un zéro avant le point décimal, comment rapporter une valeur p très faible, ou au contraire non significative, etc...

1. Introduction à la rédaction de p


1. Une valeur p est une probabilité

Une valeur p est une probabilité, plus spécifiquement la probabilité que le hasard soit suffisant pour expliquer les résultats ou, ce qui revient au même, la probabilité que l'hypothèse nulle soit vraie ou, ce qui revient encore au même, la probabilité de commettre l'erreur de type I. C'est donc un nombre pouvant prendre n'importe quelle valeur comprise entre 0 et 1. La valeur 0 représente l'absolue certitude que l'hypothèse nulle est fausse et la valeur 1 représente l'absolue certitude qu'elle est vraie. Ces deux bornes, 0 et 1, sont donc des nombres entiers qui représentent des cas limites, des sortes d'absolus généralement inatteignables dans la réalité empirique (car la certitude légitime n'existe malheureusement que dans les sciences exactes).

Dans la pratique des statistiques, au contraire des sciences exactes, la valeur p est un nombre calculé à partir de données empiriques. Et, n'ayons pas peur de le répéter c'est très important, la certitude n'est pas de mise avec les données empiriques : il existe, et il existera toujours, un doute. Ce doute devrait nous amener à n'utiliser que des valeurs p supérieures à zéro et inférieures à 1, des nombres décimaux donc.

Typiquement, une valeur p se rapporte sous l'une des formes "p = nnn" ; "p < nnn " ; ou , moins fréquemment, "p > nnn") . La lettre romane "p " (notez qu'elle est en italiques, c'est une convention utilisée en psychologie) symbolise justement la "valeur p" , et nnn représente la valeur numérique à rapporter. Sur cette base simple, nous allons voir que de nombreuses subtilités conduisent à divers formats d'écriture.


2. Anglais, français, franglais ?

Supposons que vous devez rapporter une valeur p de 12%. Spontanément, un francophone aura envie d'écrire p =0,12. Mais souvent dans un article anglophone vous verrez quelque chose comme p =.12. Comment le comprendre et quelle forme choisir pour rédiger vos rapports d'expérience, de mémoire, etc ... ? En comparant ces deux formes, on peut distinguer distinguer deux différences : (1) l'emploi du point décimal ou de la virgule, et (2) la présence ou l'absence du zéro avant la virgule ou avant le point décimal.


2.1. Faut-il mettre un point décimal ou une virgule ?

Dans les articles en français, vous pouvez trouver soit la notation anglaise, où la virgule est en fait marquée par un "point décimal", soit la notation française, avec une virgule. Dans les revues internationales, en général, c'est la norme anglo-saxonne qui s'applique. Certaines revues étant en français, vous pouvez avoir plusieurs cas de figure. Dans certains cas les responsable d'édition exigent la norme française stricte pour l'écriture des nombres, ou bien encore ils l'exigent mais font une exception pour le cas particulier des valeurs p, cas où la norme anglo-saxonne est tolérée, ou même obligatoire...

Donc pour vous, que choisir ?

  • Dans le cas des rapports de mémoire, devoir de statistiques, etc., il faut tout simplement demander à l'enseignant quelles sont ses préférences.
  • Pour la rédaction d'un article, il convient de se renseigner dans la page de recommandations aux auteurs pour savoir quel est le format demandé par les éditeurs de la revue. Ce format est spécifique à la revue. En fait, il l'est même à une période particulière de l'existence de la revue (la rédactrice ou le rédacteur en chef peut changer et avec elle ou lui les recommandations données aux auteurs).

Ces considérations s'appliqueront tout aussi bien à la question suivante :


2.2. Mettre un zéro ou pas avant la virgule ?

Dans l'exemple précité, nous avions deux formes, " p =0,12" (forme française). ou " p =.12" (norme APA). Outre la différence portant non seulement sur le caractère séparateur de la partie entière et de la partie décimale, on note la présence ou l'absence du zéro.

La logique qui prévaut à l'élision du zéro est la suivante : certains nombres sont nécessairement compris entre 0 et 1. Pour le cours de statistiques, c'est notamment le cas des probabilités--qui nous intéresse ici--, mais aussi des corrélations, et des coefficients betas dans les méthodes de régressions. Dans leur écriture, ces nombres ne peuvent pas avoir avant la virgule autre chose que "0" ou "1". Et "1" est un cas extrêmement rare (sauf après arrondi). Donc en pratique, ce qui sera à écrire avant la virgule est quasiment toujours la même chose : 0. Si l'on sait que l'on a affaire à de tels nombres, et c'est le cas lorsque l'on rapporte une valeur p, ce qu'il y a avant la virgule est tout simplement non pertinent dans l'immense majorité des cas. Ce n'est donc même pas la peine de l'écrire.

L'anglais, et a fortiori l'anglais scientifique, étant une langue portée à la concision, la norme qui s'est imposée a été tout naturellement de ne pas écrire le 0. Le français étant moins porté sur la concision, l'emploi ou non de cette forme réduite est variable et la même recommandation qu'au 2.1 s'applique.

Attention toutefois au fait que cette forme d'écriture réduite n'a de sens que pour des nombres à valeurs entre -1 et 1 (ou a fortiori entre 0 et 1). Vous ne pouvez pas l'appliquer pour rapporter un F d'analyse de variance, par exemple, celui-ci pouvant excéder 1. Dans ce cas, même si la valeur rapportée est entre -1 et 1, il faut écrire le zéro.

2. Présenter la partie décimale

Un nombre pouvant contenir un nombre potentiellement infini de chiffres non nuls (c'est le cas par exemple de la forme développée de 1/3), nous sommes souvent obligés de tronquer la partie décimale, c'est-à-dire de n'en rapporter qu'un tout petit nombre de chiffres, quitte à procéder à un arrondi.

Il faut donc savoir combien de chiffres on peut rapporter puis, s'il faut faire un arrondi, savoir comment le faire.


Combien mettre de chiffres après la virgule ?

Les normes actuelles -- cela change légèrement d'une version à l'autre du Manuel de l'APA (American Psychological Association) sont de rapporter deux chiffres après la virgule, sauf cas particulier.

Un exemple important de cas particulier est constitué des cas où la valeur à rapporter est inférieure à .01. En effet, si par exemple la valeur à rapporter est en 0,001, et que l'on applique les méthodes classiques pour faire les arrondis avec deux décimales, méthodes sur lesquelles nous ne reviendrons pas ici, on aurait pour résultat... 0.

Or, il existe dans la littérature scientifique une sorte de principe de prudence plus ou moins explicite selon lequel, lorsqu'un biais doit être commis, alors, si l'on a le choix, on doit préférer le biais qui nous désavantage (prudence) que celui qui nous avantage (optimisme). Cela se comprend pour des raisons évidentes de rigueur. Qui peut le plus peut le moins et si l'erreur est en votre défaveur, elle ne nuit pas à votre thèse. Si au contraire l'erreur est en votre faveur, on pourra toujours avoir un doute, voire vous reprocher de l'avoir commise intentionnellement.

Pratiquer un arrondi revient à commettre un biais. Par exemple, si vous choisissez d'arrondir votre ".001" en "0", vous sous-estimez le risque réel de type I. Cela revient à transformer "il existe une chance sur mille de se tromper" en "il est absolument certain que l'on ne se trompe pas" !!! Pour petite qu'elle soit quantitativement, la différence est qualitativement majeure !

Une première solution, dans ce cas précis, consiste à simplement s'autoriser d'utiliser trois décimales et non 2. Fin du problème.

Mais voilà, supposons que la valeur calculée soit "0,000001". Il n'est pas correct de rapporter tant de décimales, car cela suggère un niveau de précision dont on ne dispose en fait généralement pas. En même temps, une valeur p si petite est très intéressante, car elle est loin du seuil de signification, même le plus strict habituellement rencontré. Une solution, fort peu élégante, mais encore employée par certains logiciels de statistiques, consiste à écrire "p =.000". Cela véhicule implicitement l'idée qu'il y a eu arrondi. Ce n'est pas souhaitable pour vous de suivre cet usage et les normes APA 7e édition sont claires sur ce point : il faut écrire "p<.001".

Cette troisième solution, qui consiste à utiliser une inégalité au lieu d'une égalité, appelle quelques commentaires supplémentaires que nous allons voir maintenant.

3. Quand utiliser " p =", " p <" ou " p >" ou ns ?

A. Pourquoi utiliser une inégalité ?

La solution consistant à rapporter " p =.000" est utilisable par un logiciel de statistique qui ne connait pas les hypothèses du chercheur, et ne peut donc pas savoir où est l'optimisme ni où est la prudence. L'arrondi a-t'il eu lieu par excès ? Par défaut ? Avec un tel résultat, nous ne le saurons jamais.

Si l'on applique le principe de prudence, on peut donc utiliser une inégalité qui elle sera vraie dans tous les cas, en écrivant " p<.001". En effet, si un nombre a pour arrondi ".000" à la troisième décimale, c'est nécessairement qu'il est plus petit que 0.001. Donc l'inégalité est non biaisée. Elle est prudente, mais néanmoins correcte.


B. Quand utiliser ns ?

Note : Signalons d'emblée que dans la première rédaction de cette page, l'emploi du ns était dans les normes APA 6e édition mais les normes APA 7e édition ont renoncé à cet usage. Sachez toutefois qu'en 2023 certaines revues importantes exigent encore l'utilisation des normes de la 6e édition. Aussi, si vous voulez comprendre un texte rédigé selon la 6e édition, cette section est pour vous.

Dans le cas le plus fréquent, lorsque l'on rapporte des valeurs p, on utilise des seuils de criticités conventionnels à .05 ; .01; ou .001. Normalement, dès que la valeur p dépasse .05, on n'est donc plus significatif. En ce cas, le manuel de l'APA 6e édition, préconise d'écrire tout simplement ns (pour "nonsignificant", "non significatif" en français). Comme si une fois passé le seuil fatidique--et pourtant relatif puisque purement conventionnel-- la valeur exacte n'intéressait plus le chercheur. C'est pour le moins discutable.

En effet, supposons que vous fassiez deux expériences indépendantes telles qu'à chaque expérience la valeur p est .10. Dans l'idée précédente, vous écrivez ns dans les deux cas et fin de l'histoire. Mais en fait, si vos deux expériences sont vraiment indépendantes, alors la probabilité combinée de l'erreur de type I après les deux expériences peut se calculer : c'est .1x .1 = .01. Et cette fois, pour les deux expériences prises ensemble, c'est significatif, ce qui au minimum doit inciter à la prudence. C'est pourquoi l'on s'autorise qualifier une valeur p entre 0,05 et 0,10 de "tendancielle", c'est-à-dire, qui indique une tendance, plutôt que véritablement non significative. Pour une telle valeur, il ne paraît donc pas opportun de rapporter simplement ns. Si l'on raisonne à l'envers, on peut se dire que pour que deux expériences non significatives et indépendantes soient significatives prises ensemble, il suffit qu'elles aient chacune une valeur p de 0,22. C'est pourquoi, de manière générale, il paraît raisonnable de rapporter explicitement les valeurs p jusqu'à environ .20. Au-delà, effectivement, un simple ns peut parfois suffire.


C. Quand utiliser " p <" ou " p >" ? Appliquer le principe de prudence

De manière générale, on doit respecter deux principes : le principe de prudence vu plus haut, et bien sûr un principe de précision qui veut qu'on soit le plus précis possible dans ses rapports.

Donc, si par exemple, vous voulez rapporter une valeur de .103 avec deux décimales. Un arrondi simple à deux décimales donnerait .10. On va alors appliquer le principe de prudence.

1er cas : votre hypothèse de recherche est contre l'hypothèse nulle. Donc rejeter l'hypothèse nulle vous est favorable. De ce point de vue, l'arrondi à .10 est optimiste, puisqu'il sous-estime p, ce qui va contre le principe de prudence... On préférera alors arrondir de façon prudente, au moyen d'une inégalité en écrivant "p<.11".

2e cas : vous croyez au départ à l'hypothèse nulle (par exemple, vous faites une expérience où vous cherchez à rejeter une théorie existante, qui prédit une différence). En ce cas, l'arrondi à .10 est tolérable, mais permet aux sceptiques de penser que la valeur réelle était peut-être comprise entre .095 et .10, ce qui va contre ce que vous voulez montrer. Il est donc plus avantageux pour vous d'écrire, tout en restant factuel, "p > .10".