Statistique : Tester l'association de variables

Cette grande leçon présente, sous l'angle de la statistique inférentielle, les principales méthodes pour tester l'existence d'une association entre variables : corrélations de variables numériques (r de Pearson) ordinales (\rho de Spearman, \tau de Kendal), ou nominales (\chi^2 et \phi). Après un rappel de la régression linéaire simple, on introduit la corrélation partielle. Finalement, cinq articles sont consacrés à la corrélation multiple.

7. Régression linéaire multiple : Ordre d'introduction des variables

7.4. La Méthode Statistique Descendante

Le principe est exactement le contraire de celui de la méthode ascendante. On introduit d'abord toutes les VI possibles et on applique la méthode standard. Ensuite, les variables dont la probabilité de contribution n’atteint pas un certain seuil sont progressivement éliminées, une par une. Ce critère d’élimination est un paramètre que le chercheur peut fixer. Généralement, on utilise le seuil de p =.10. On remarquera que cette valeur est plus prudente que celle du critère d’introduction.

En reprenant les données précédentes, cela donne ceci :   

On voit ici que la méthode descendante permet de savoir ce qu’on perd en éliminant une variable donnée, mais ensuite la distribution des contributions est la même qu’avec la méthode standard. Bien entendu, la variance totale expliquée reste identique à celle obtenue dans les autres méthodes.