Statistique : Tester l'association de variables: Récapitulatif du modèle

Calendrier Rechercher des cours Aide et guides

Cette grande leçon présente, sous l'angle de la statistique inférentielle, les principales méthodes pour tester l'existence d'une association entre variables : corrélations de variables numériques (r de Pearson) ordinales ( $\rho$ de Spearman, $\tau$ de Kendal), ou nominales ( $\chi^2$ et $\phi$ ). Après un rappel de la régression linéaire simple, on introduit la corrélation partielle. Finalement, cinq articles sont consacrés à la corrélation multiple.

2. Régression linéaire simple : approche inférentielle

2.3. Récapitulatif du modèle

R (ou « R multiple » dans Statistica) : Il s’agit de la corrélation que l’on peut constater entre les données prédites par la droite calculée et les données réellement observées.

R traduit donc l’ajustement du modèle aux données et doit se rapprocher le plus possible de 1.

R -deux ou R² : c’est simplement le carré de R . Le carré d’une corrélation traduit la part de la variance du nuage de points expliquée par la droite de régression. Ici, la droite de régression est le modèle et R ² traduit donc la part de variance expliquée par le modèle, en l’occurrence 41,1%.

On peut aussi calculer R² directement comme part de variance expliquée par le modèle, et prendre sa racine carrée pour calculer R.

R -deux ajusté : Dans le cas général (régression multiple), c’est une valeur de R corrigée, essentiellement pour réduire un biais lié au fait que chaque prédicteur supposé peut expliquer une partie du nuage de points par le seul fait du hasard. Dans le cas de la régression simple, si n est le nombre d’observations, on a

Lorsque l’on rapporte la part de variance expliquée par le modèle, mieux vaut rapporter la valeur du R ² ajusté.

Ce dernier tend vers R ² lorsque le nombre de prédicteurs est petit et lorsque le nombre d’observations devient grand. Dans SPSS et Statistica, le R²ajusté est calculé par la formule précédente mais il en existe d’autres, pour le cas où l’échantillon est petit.

Erreur standard de l’estimation : indice de dispersion des valeurs prédites. Il est égal à l’écart type des valeurs prédites divisé par la racine carrée du nombre d’observations. On utilise l’erreur standard plutôt que l’écart-type afin de pouvoir comparer des modèles ne comportant pas le même nombre d’observations.

Accessibilité

Tout remettre à zéro

Couleur de fond

Police

Taille de police

Couleur de texte

Crénage de la police

Visibilité de l’image

Espacement des lettres

Hauteur de ligne

1.2

Surbrillance de lien

Alignement du texte

Largeur de paragraphe

Vous êtes sur la plateforme de cours en ligne de l'Université Toulouse - Jean Jaurès.
En cas de difficulté avec IRIS, veuillez contacter l'administrateur via le service d'assistance en ligne MINGUS, accessible depuis l'ENT, ou à cette adresse : https://mingus.univ-tlse2.fr/.

Pour tout autre problème (perte de mot de passe, accès WiFi, services de l'ENT en panne, etc.), adressez une requête au service d'assistance en ligne ALADIN, accessible depuis l'ENT ou à cette adresse : https://aladin.univ-tlse2.fr.