Statistique : comparer des moyennes

Cette grande leçon introduit les principales stratégies permettant de comparer des moyennes par rapport à une valeur de référence ou des moyennes entre elles. Le test de student est étudié en détail, ainsi que l'ANOVA à un facteur. On introduit les concepts de comparaisons planifiées et tests-post-hoc.

5. Comparaisons planifiées dans l'ANOVA : contrastes

5.2. Quels coefficients choisir ?

Bien qu'extrêmement libre, le choix des coefficients ne se fait tout de même pas au hasard car certaines contraintes devraient être respectées.

En particulier il faut équilibrer les deux côtés de la comparaison, ce qui se traduit par le fait que la somme des coefficients soit nulle.


2.1. Nullité de la somme des coefficients

Les coefficients vont déterminer le poids de chaque groupe dans la comparaison. La seule vraie contrainte que nous ayons pour que l'on puisse parler de contraste est la nullité de la somme des coefficients :il faut que la somme des coefficients positifs soit égale à la somme des coefficients négatifs. Brauer et McClelland (2005) parlent alors de "contraste centré".

En reprenant l'exemple précédent nous pourrions noter notre contraste

(2;0;-2;2;-2) 

 et le résultat serait exactement le même. Ou encore

  (-0.5;0;0.5;0;-0.5;0.5) 


2.2. Comment affecter les poids des groupes à l'intérieur d'un des deux agrégats ?

2.1.1. Le cas standard (effectifs équilibrés)

Imaginons que nous ayons à comparer cinq groupes, deux d'un côté, trois de l'autre. Nous ne pouvons évidemment pas donner les mêmes valeurs absolues aux coefficients positifs et négatifs sinon nous ne pourrons pas avoir une somme nulle des coefficients puisque justement nous n'avons pas le même nombre de coefficients négatifs et positifs.

Une solution consiste à prendre comme valeur absolue l'inverse du nombre de groupes à agréger. Du côté où l'on a deux groupes, nous donnerons donc 1/2 et 1/2. Du côté où l'on a trois groupes cela donnera 1/3; 1/3; 1/3. Il ne reste alors qu'à attribuer un signe (arbitrairement) à l'un des deux blocs de coefficients et le tour est joué. On aura ainsi par exemple

  (-0.5;033;0.33;-0.5;0.33) 

Cela dit ce n'est pas très élégant et en outre on perd un centième lors de la sommation des arrondis. On peut alors tout multiplier par 3 pour avoir des valeurs sans arrondis :

  (-1.5;1;1;-1.5;1) 

Si l'on veut se débarrasser complètement des décimales, on peut encore tout multiplier par 2 :

  (-3;2;2;-3;2) 

Ces trois jeux de coefficients donneront exactement le même résultat statistique, mais la dernière version sera peut-être plus facile à manipuler.

Remarquons qu'on pouvait obtenir directement ce résultat avec une règle consistant à attribuer comme coefficients aux éléments d'un agrégat, le nombre d'éléments de l'autre agrégat. Ici on contraste 2 groupes contre trois, donc on met 3 aux deux groupes du premier agrégat et 2 aux trois groupes du deuxième agrégat. Il ne reste alors qu'à attribuer un signe "-", toujours arbitrairement, à l'un des deux blocs de coefficients.


2.1.2. Les effectifs déséquilibrés

Techniquement, c'est le cas lorsque les effectifs entre les groupes sont différents. Toutefois, lorsque les différences d'effectifs sont imputables aux seules fluctuations aléatoires d'échantillonnage (comme lorsque l'on perd quelques données dans chaque groupe, mais pas  la même quantité), on peut, selon Howell, se rabattre sur le calcul précédent, ce qui revient fondamentalement à donner le même poids à toutes les moyennes, même si elles sont issues d'effectifs différents. 

Lorsqu'au contraire les différences d'effectifs traduisent une réalité (par exemple si on mène une expérience dans un milieu où existe une grande majorité de femmes, le plus grand nombre de femmes dans les échantillons ne doit rien au hasard) et que donc on souhaite donner plus de poids aux moyennes des groupes représentant une part plus importante de la population globale, on peut calculer la moyenne pondérée par les effectifs.

Pour ce faire, chaque groupe à inclure dans l'un des deux agrégats (les autres garderont un coefficient nul quel que soit leur effectif) recevra un coefficient dont la valeur sera le rapport entre son effectif et l'effectif global de l'agrégat. Par exemple si on contraste trois groupes d'effectifs 7, 8 et 9 contre deux groupes d'effectifs 8 et 10, les trois premiers recevront les coefficient 7/(7+8+9); 8/(7+8+9); et 9/(7+8+9). Les deux derniers groupes recevront les coefficients 8/(8+10) et 10/(8+10). Bien sûr, il faudra choisir de négativer les coefficients de l'un des deux agrégats.

Voyons maintenant comment tester la significativité du contraste.