Statistique descriptive

Cette troisième grande leçon présente l'ensemble des concepts de base nécessaires à la description quantifiée d'observations. Elle constitue le vrai cœur de l'enseignement de la Statistique en L1 et l'étudiant y retrouvera exposés les principaux concepts qu'il aura vus dans ses cours. Toutefois, nous n'aborderons pas ici les aspects analytiques de l'inférence statistique, c'est-à-dire les concepts et méthodes permettant d'évaluer la fiabilité des résultats descriptifs et pour lequel nous renvoyons l'étudiant au cours de L2.

Rédaction : Éric Raufaste

3. Indices de dispersion

3.3. Dispersion des variables nominales

Pour des variables nominales, la seule relation qui existe entre les modalités est l'exclusivité mutuelle, à savoir que si une observation tombe dans une modalité, elle ne tombe pas en même temps dans une autre. Si un sujet possède la modalité Homme sur la variable Sexe, il ne possède pas la modalité Femme.

Ceci étant posé, il ne reste pas beaucoup de possibilités pour évaluer la dispersion des données. On peut simplement travailler sur les fréquences d'observations qui tombent dans chaque modalité. La quantité utilisée pour quantifier la dispersion avec des variables nominales s'appelle l'entropie, mais son utilisation dépasse le niveau d'un cours de statistiques de L1 en sciences humaines, aussi ne la verrons-nous pas plus avant pour le moment. Pour le moment, il suffit de retenir les principes suivants :

1°) plus il y a de modalités à effectif non nul, et plus la dispersion est grande.

2°) Pour un nombre de modalités possibles donné, la dispersion est maximale, si les observations sont également distribuées dans toutes les modalités. Elle est minimale si toutes les observations sont regroupées dans une seule modalité.