Moyenne

Site: IRIS - Les cours en ligne de l'UT2J
Cours: UOH / Statistique et Psychométrie en L1
Livre: Moyenne
Imprimé par: Visiteur anonyme
Date: jeudi 9 mai 2024, 18:29

Description

Objectif. Définir la moyenne d'une variable quantitative.

Prérequis. Échelles de mesureConventions de notation (en particulier, somme algébrique)

Résumé. Soit une variable définie sur une population de N individus, on définit la moyenne de cette variable. On estime cette moyenne à l'aide de la moyenne d'un échantillon représentatif de la population.

rédaction : Éric Raufaste

1. Moyenne d'une variable dans une population

Nous devrons distinguer deux cas : la valeur moyenne d'une variable dans une population (par exemple le niveau de bonheur moyen de toute la population française) et la valeur moyenne d'un échantillon restreint de la population française, échantillon sur lequel on fait la mesure (par exemple 1000 personnes) et que nous prendrons ensuite comme estimation de la valeur vraie de la population cible.


Soit une variable quantitative X définie sur une population de N individus. Par exemple, X prend comme valeur la taille des individus.

La moyenne de la variable X est un indice de tendance centrale qui se calcule comme la somme de toutes les observations divisée par le nombre d'observations. C'est donc une « valeur par observation » dans l'échantillon considéré.

La moyenne de la variable X, ou encore, dans le cas de la taille des individus, la taille moyenne de la population est dénotée par l'une des formes suivantes (selon les textes, on peut rencontrer les trois) : 

\mu(X), ou \mu_X, ou \overline{X}

En utilisant les conventions de notations pour les sommes algébriques, on a alors

\mu(X)=\frac{\sum_{i=1}^nX_i}{n}=\frac{X_1+X_2+\ldots+X_n}{n}

Bien entendu, connaître exactement cette valeur supposerait de faire des mesures sur chacun des individus de la population cible. Dans le cas d'une population aussi vaste que la population française, cet objectif est hors d'atteinte la plupart du temps. Il faut donc en obtenir une estimation à partir de la moyenne observée sur un sous-ensemble de cette population, un échantillon.

2. Estimation de la moyenne d'une variable à partir d'un échantillon

Une estimation de la taille moyenne est obtenue par la moyenne de la taille des n individus d'un échantillon représentatif de la population. Cette estimation est dénotée par l'une des deux formes suivantes (vous pouvez rencontrer les deux) :  m(X) ou m_X.

Mais l'estimation de la population à partir de l'échantillon implique un petit biais que l'on corrige en divisant la somme des termes non par n mais par n-1.

Toujours en utilisant les conventions de notations pour les sommes algébriques, on a alors

m(X)=m_X=\frac{\sum_{i=1}^nX_i}{n-1}=\frac{X_1+X_2+\ldots+X_n}{n-1}


3. Quelques propriétés remarquables de la moyenne

a. Si l'on ajoute une constante à toutes les notes d'un échantillon, la nouvelle moyenne est directement donnée en ajoutant la constante à l'ancienne moyenne, soit :

m(X+a)=m(X)+a

Autrement dit, si tous les individus d'une classe d'élèves améliorent leurs notes en maths de 2 points, alors la moyenne globale de la classe sera aussi augmentée de 2 points.

b. Si l'on multiplie par une constante toutes les notes d'un échantillon, la nouvelle moyenne est directement donnée en multipliant l'ancienne moyenne par la constante, soit :

m(a.X)=a.m(X)

Par exemple, suite à l'application d'une TVA de 19,6% sur les articles d'un magasin, (on multiplie chaque prix par 1,196) la moyenne du prix des articles après application de la TVA sera égale à la moyenne des prix avant TVA multipliée par 1,196.

c. Si l'on ajoute les notes de deux variables, observation par observation, la moyenne de la variable qui contient cette somme est égale à la somme des moyennes des deux variables d'origine, soit :

m(X+Y)=m(X)+m(Y)

Par exemple, si le score moyen d'intelligence d'une population s'obtient en additionnant les notes obtenues à une épreuve verbale et à une épreuve visuo-spatiale, alors la note moyenne globale obtenue sera égale à la somme des moyennes relatives à chacun des deux tests.