Savoir trouver les valeurs critiques du t de student

Lorsque l'on réalise des tests statistiques "à la main", c'est-à-dire en appliquant soi-même des formules, par opposition à l'utilisation d'un logiciel de statistiques qui contient des formules pré-programmées, on calcule une certaine statistique (par exemple le t de student ou le \chi^2), qu'il faut ensuite convertir en valeur p pour prendre une décision.

Dans la plupart des cas, il n'y a pas de formule simple pour calculer ces valeurs p et l'on va donc utiliser des tables permettant la conversion entre certaines valeurs que peut prendre la statistique t calculée et les valeurs p. requises pour la décision statistique. On recourt alors à des tables dont on explique ici l'utilisation.


Interpréter des résultats de test t à échantillons indépendants

Interpréter les sorties d'un test t à 2 échantillons indépendants réalisé sous R (version 2.12)

Ayant procédé au test sous R 2.12.1 (nous partons ici de l'idée que le test a été lancé à partir du package RCmdr, menu "Statistiques/Moyennes/t test univarié"), notre chercheur obtient le tableau de résultats suivant :

Explication des lignes de résultats

Two sample t-test :

C'est le nom anglais de la procédure, littéralement "test t à deux échantillons"

Data : Psycho1by Sexe

Rappel précisant qu'on a testé la variable Psycho1, en construisant des groupes basés sur les deux modalités de la variable Sexe

t = -1.6517, df = 895, p-value = 0.09895

t : C'est tout simplement la valeur du t de student, -1.6517 arrondie à la quatrième décimale

df : abbréviation anglaise de "degrees of freedom". C'est le nombre de degrés de libertés de la comparaison, soit, pour une comparaison à échantillons indépendants, le nombre de sujets moins 2, soit 895.

p-value : C'est la valeur du risque de type 1 ou risque alpha, la fameuse valeur p. Ici, arrondie à la cinquième décimale, soit 0,09895. Comme cette valeur dépasse le seuil de 5%, soit 0,05, on considérera le test comme non significatif, et donc que la passation de l'épreuve ne discrimine pas les deux sexes. Cela étant, puisque cette valeur est <.10, on pourra la considérer comme tendancielle. Peut-être faudrait-il regarder plus près dans l'épreuve quels sont les items qui différencient le plus les deux sexes et retirer ces items du test.

alternative hypothesis: true difference in means is not equal to 0

L'hypothèse nulle d'une comparaison de moyennes représente l'égalité. Ici, on compare les moyennes de la variable Psycho1 obtenues pour les hommes et les femmes. Donc l'hypothèse nulle est que la moyenne de la différence est 0. Autrement dit que l'écart entre la valeur réelle de cette différence et 0 n'est du qu'à des effets aléatoires.

L'hypothèse alternative est que l'hypothèse est fausse et donc que la différence "réelle" (true difference en anglais) dans la population d'où est tiré l'échantillon n'est PAS égale à 0.

95 percent confidence interval:
-4.2808916 0.3683057

Il s'agit de l'intervalle de confiance à 95% de la différence des moyennes, les bornes inférieure et supérieure de l'intervalle calculé de manière à ce que la moyenne "réelle"de la population ait 95% de chance d'être contenue dedans.

sample estimates:
Mean in group Hommes  Mean in group Femmes
    67.07623                              69.03252

Il s'agit des estimations des moyennes réalisées à partir de l'échantillon arrondies à la cinquième décimale, pour les hommes et pour les femmes.


Comment rapporter les résultats

Classiquement, on rapportera la statistique descriptive dans une table ou dans le texte, et les statistiques inférentielles plutôt dans le texte.

Ici, nous imaginerons le cas de résultats rapportés dans le texte, en utilisant les normes APA 7e édition.

Après avoir arrondi les valeurs, idéalement à la deuxième décimale, éventuellement à la troisième, cela pourrait donner quelque chose comme cela :

"La moyenne des hommes à l'épreuve Psycho1 est 67.08 (SD = 12.26) alors que celle des femmes est 69.03 (SD =11.84). La différence, qui au demeurant est en faveur des femmes, n'est cependant que tendancielle t(895) = 1.65, p < .10 " et les variances peuvent être considérées comme homogènes."

On ne rapporte généralement pas les tests de signification pour l'homogénéité des variances, car si les variances ne sont pas homogènes, on applique généralement une variante du test t, le test de Welch.

Notez les italiques qui s'appliquent aux lettres représentant des symboles comme t ou p. Le test d'homogénéité des variances n'étant clairement pas significatif, nous nous sommes limités à énoncer le résultat. Veuillez noter aussi la précaution "peuvent être considérées comme homogènes". En effet, les accepter définitivement comme homogène reviendrait à dire que l'hypothèse nulle est vraie, ce que l'on ne doit fait jamais faire (car on ne peut en être certains).