Statistique : comparer des moyennes: Décomposer la somme des carrés

3. Comparer plus de deux moyennes : L'ANOVA à un facteur

3.5. Décomposer la somme des carrés

Pourquoi nous intéresser à la somme des carrés, qui n'est après tout qu'un morceau de l'équation de la variance ?

Rappelons que nous cherchons à attribuer l'ensemble des variations constatées de la VD à l'une de deux sources de variations possibles : les variations dues au facteur étudié (variations inter-groupes) et celles dues à d'autres déterminants inconnus (variations intra-groupes). Le problème était que la variance n'est pas additive, car dans le cas général on n'a PAS le droit d'écrire que Var _Tot = Var _Inter + Var _Intra .

Et c'est là tout l'intérêt de raisonner à partir de la notion de somme des carrés car la somme des carrés possède une propriété cruciale que n'a pas la variance : Elle permet d'écrire l'équation très intéressante suivante :

SC_totale = SC_Traitements + SC_erreur

À partir de là,

si l'on sait calculer deux des trois sommes de carrés, on peut très facilement retrouver la troisième. Or, nous verrons que la SC _Totale et la SC _Traitements sont très faciles à calculer. Il suffit alors de retourner l'équation pour avoir la SC _erreur :
SC_erreur = SC_totale - SC_Traitements
si l'hypothèse nulle est vraie, alors la somme des carrés totale est égale dans le principe à la somme des carrés de l'erreur et la somme des carrés du traitement est nulle. Bien sûr, dans la pratique, on n'a quasiment jamais cette observation idéale. Néanmoins, elle peut servir de référence pour voir à quel point les résultats s'écartent de ce que donnerait l'hypothèse nulle si elle était vraie. Nous reviendrons sur ce point lors du calcul de l'inférence statistique.

Pour le moment, regardons comment calculer la première somme des carrés, la SC_Totale.

Accessibilité

Tout remettre à zéro

Couleur de fond

Police

Taille de police

Couleur de texte